یک پای یادگیری ماشین بدون ریاضیات می‌لنگد!

چرا ریاضی؟

رابطه‌ی هوش‌ مصنوعی و ریاضیات را می‌توان این‌گونه بیان کرد: 

کسی که در حوزه‌ی هوش‌مصنوعی فعالیت می‌کند و ریاضی نمی‌داند مانند سیاستمداریست که نمی‌داند چگونه دیگران را قانع کند.

یادگیری ماشین مجموعه‌ای از عملیات ریاضی‌ است و بر اساس اصول ریاضی مثل جبر خطی، حساب دیفرانسیل، آمار و احتمال ساخته شده است. داشتن درک ریاضی برای فهمیدن مفاهیم یادگیری ماشین بسیار ضروری‌است.

 

 دلایل اهمیت ریاضی برای یادگیری ماشین:

  • دانش ریاضی به شما کمک می‌کند که الگوریتم یادگیری ماشین درست و مناسب را برای مسئله‌ی پیش رو انتخاب کنید
  • تخمین میزان اعتماد ما به نتیجه مدل با تولید فاصله اطمینان مناسب و اندازه گیری عدم قطعیت، به درک ریاضی نیاز دارد
  • مدل مناسب بسیاری از جنبه‌ها مانند معیارها، زمان آموزش، پیچیدگی مدل، تعداد پارامترها و تعداد ویژگی‌ها را در نظر می‌گیرد که برای درک همه این جنبه‌ها به ریاضیات احتیاج داریم
  • با دانستن ریاضیاتِ مدل‌های
  • یادگیری ماشین، می‌توانید مدل شخصی‌سازی شده‌ای را مناسب با مسئله‌ی خودتان توسعه دهید

 

کدام مباحث ریاضی در یادگیری ماشین مهم اند؟

با این که قصد یادگیری ریاضیات وجود دارد، مسئله این است که کدام مباحث را نیاز است برای یادگیری ماشین یاد بگیرید. به هر حال ریاضی بسیار گسترده است. مباحثی که نیاز داریم برای یادگیری ماشین بلد باشیم:

  • جبر خطی (Linear Algebra)
    جبرخطی یکی از شاخه‌های ریاضیات است که در یادگیری ماشین و علوم‌داده نقش فوق‌العاده‌ای دارد و مهم‌ترین مهارت ریاضی در یادگیری‌ ماشین به حساب می‌آید. بیشتر مدل‌های یادگیری ماشین می‌توانند به فرم ماتریسی بیان شوند. مجموعه‌ داده اغلب به صورت ماتریس نمایش داده می‌شود و امکان اجرای عملیات ماتریسی را روی داده به ما می‌دهد. جبر خطی در پیش‌پردازش داده، تبدیل داده و ارزیابی داده استفاده می‌شود.
    سرفصل‌ها: بردارها، ماتریس‌ها، مقادیر و بردارهای ویژه، تحلیل مولفه‌ی اصلی، تجزیه مقادیر منفرد

  • حساب دیفرانسیل و انتگرال (Calculus)
    برای تنظیم دقیق نتایج استفاده می‌شود و به کمک آن می‌توانیم کارایی الگوریتم‌ها را بهینه کنیم. در واقع ما به حساب دیفرانسیل و انتگرال چند متغیره احتیاج داریم چون معمولا توابعی که با آن‌ها سر و کار داریم بیش از یک متغیر دارند.
    سرفصل‌ها: توابع، مشتق نرده‌ای، گرادیان، حساب بردار و ماتریس، الگوریتم‌های گرادیان

 

 
ریاضیات در ماشین لرنینگ
ریاضیات در یادگیری ماشین
  • احتمال (Probability)
    به کمک علم احتمال می‌توانیم امکان اتفاق افتادن وقایع را در یادگیری ماشین پیش‌بینی کنیم.
    سرفصل‌ها: قواعد ابتدایی و کلی، متغیرهای تصادفی- پیوسته و گسسته، امید ریاضی، واریانس، توزیع- توام و شرطی، توزیع‌های معروف: دوجمله‌ای، برنولی، پواسون، نمایی و گوسی

  • آمار(Statistics)
    از آمار برای گرفتن نتایج منطقی از مجموعه‌داده‌ی داده شده استفاده می‌شود.
    سرفصل‌ها: توزیع، گرایش مرکزی، کج بودن، ضریب همبستگی خطی، قضیه حد مرکزی، آزمایش فرضیه

  • سایر
    سرفصل‌ها: تئوری اطلاعات، زنجیره‌ی مارکف

چگونه یاد بگیریم؟

حال با این که می‌دانیم چه مباحثی را باید بلد باشیم، هنوز هم مباحث برای یادگیری گسترده هستند. یادمان باشد که می‌خواهیم ریاضیات را برای یادگیری ماشین یاد بگیریم؛ نه فقط هر مبحثی در ریاضی را. به همین دلیل نیاز داریم که ارتباط مباحث را با الگوریتم‌های یادگیری ماشین بدانیم. 

برای مثال، ممکن است با استفاده از کتابخانه‌های موجود برای یک زبان برنامه‌نویسی (مثل sklearn در پایتون) از مدل رگرسیون خطی استفاده کرده باشید و بلد باشید چگونه از آن استفاده کنید ولی ندانید که این الگوریتم دقیقا چطور کار می‌کند. در اینجا با جستجو با اصطلاحات جدیدی روبه‌رو می‌شوید که شما را به سمت مفاهیم توابع خطی و رگرسیون خطی هدایت می‌کند و می‌توانید ریاضیات آن را بهتر متوجه شوید. 

باید توجه داشت که مباحث یادگیری ماشین و علوم داده درهم‌ تنیده هستند ولی مفاهیم و تصویر کلی آن‌ها از ریاضی متفاوت است به همین دلیل لازم است هنگام یادگیری ریاضیات تمرکز روی یادگیری ماشین باشد. در علوم داده، داده‌ی موجود آنالیز و فرضیه‌ها آزمایش می‌شوند به همین دلیل بیشتر تمرکز روی مباحث احتمالی است. در حالی‌که ریاضی در یادگیری ماشین متفاوت است و تمرکز روی جبر خطی به عنوان پردازش ابتدایی بیشتر مدل‌هاست و از حساب دیفرانسیل برای بهینه‌سازی استفاده می‌شود که پشتوانه‌ی بیشتر الگوریتم‌های یادگیری ماشینی است که استفاده می‌کنیم. البته منظور این نیست که یادگیری مباحث علوم داده بی‌فایده است. برعکس، این مباحث حتی می‌توانند به عنوان پیش‌نیاز یادگیری ماشین باشند.

 

منبع؟

با توجه به آن‌چه پیش تر در مورد نوع یادگیری ریاضی برای یادگیری ماشین متذکر شدیم، لازم است منابع در راستای یادگیری ماشین باشند. به همین دلیل در ادامه دوره‌های آموزشی، کتاب و آموزش‌های ویدئویی را معرفی می‌کنیم که برای یادگیری مفید خواهند بود.

منابع آموزشی:

  • آموزش‌های سایت Coursera
    سایت Coursera در سه دوره مجزا ریاضیات مورد نیاز این حوزه را آموزش می‌دهد. این سه دوره که از طریق لینک دوره‌های ریاضیات ماشین لرنینگ قابل دسترسی هستند، عبارتند از جبرخطی و حساب دیفرانسیل چندمتغیره و PCA.

کتاب‌ها:

  • یکی از منابع مهم یادگیری مباحث ریاضی، کتاب «ریاضیات برای یادگیری ماشین» است. در این کتاب مباحث زیر در فصل‌های مجزا پوشش داده شده است که نشان می‌دهد این کتاب نسبتا منبع جامعی‌است.
    1. Linear Algebra جبر خطی 
    2. Analytic Geometry هندسه تحلیلی
    3. Matrix Decompositions تجزیه ماتریس
    4. Vector Calculus حساب برداری
    5. Probability and Distribution احتمال و توزیع
    6. Continuous Optimization بهینه‌سازی پیوسته

  • کتاب دیگری که می‌توانید با آن شروع کنید، کتاب Mathematics for Machine Learning است که نوشته‌ی Garrett Thomas در سال ۲۰۱۸ است. 

  • اگر می‌خواهید مباحث را عمیق‌تر و به صورت جدا مطالعه کنید، کتاب‌های زیر به ترتیب برای یادگیری جبرخطی و حساب دیفرانسیل چندمتغیره مفید خواهند بود.

منابع آموزشی ویدئویی:

اگر با ویدئو دیدن میانه‌ی خوبی دارید، با لینک‌های زیر می‌توانید به ویدئوهای آموزشی دسترسی داشته باشید. دو لینک اول، دو ویدئو هستند که به آموزش جبرخطی و حساب دیفرانسیل در حدود ۱۰ ساعت می‌پردازد و لینک آخر پلی‌ لیستی متشکل از ۴ ویدئوست که بهینه‌سازی را آموزش می‌دهد. 

نتیجه‌؟

هدف ما نشان‌دادن اهمیت ریاضیات برای یادگیری ماشین و معرفی منابعی برای یادگیری مباحث ضروری بود، اما در نهایت مهم است که تعادلی بین عمیق شدن در مباحث ریاضی، تئوری و پیاده‌سازی الگوریتم‌های یادگیری ماشین برقرار شود که این مسئله به فرد و انتظاراتی که از این حوزه دارد بستگی دارد.

دوره آمادگی آزمون GRE

برای آشنایی با آزمون GRE و نحوه مطالعه برای آزمون، کلیک کنید!

به اشتراک بگذارید:

Share on email
Share on twitter
Share on linkedin
Share on telegram
Share on whatsapp
دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته‌بندی نشده
سید محمد مومنی

هوش مصنوعی اسپاتیفای

در این نوشته بررسی می‌کنیم که اسپاتیفای چگونه از هوش مصنوعی و یادگیری ماشین در بهبود تجربه کاربرانش استفاده می‌کند.