مدلهای Machine Learning چیستند و چگونه کار میکنند؟
مدلهای یادگیری ماشینی (ML) اجزای هوش مصنوعی هستند که الگوریتمهای ویژه آموزشدیده ایجاد میکنند. مدلهای ML به کامپیوترها امکان میدهند پیشبینی کنند، اطلاعات را طبقهبندی کنند و بینشهایی را از دادهها کشف کنند بدون اینکه بهصورت صریح برای این کار برنامهریزی شده باشند. در این مقاله، ما درباره چگونگی ایجاد مدلهای ML و اینکه چگونه سازمانها میتوانند از استقرار آنها بهرهمند شوند، بحث خواهیم کرد.
مدلهای ML با تحلیل مجموعههای داده بزرگ ایجاد میشوند، فرآیندی که بهعنوان آموزش شناخته میشود. مجموعه دادهای که برای آموزش مدل استفاده میشود میتواند تقریباً هر چیزی باشد — ساختاریافته، غیرساختاریافته، برچسبدار یا بدون برچسب. برای مثال، دادههای آموزشی میتوانند شامل مجموعه عظیمی از تصاویر، آرشیوی از مکالمات چتبات، سالها تراکنشهای مالی تاریخی یا دادههای حسگر تجهیزات کارخانه باشند، برای نام بردن از چند کاربرد رایج. یک مدل ML که روی این مجموعههای داده آموزش دیده است ممکن است برای شناسایی و طبقهبندی تصاویر جدید، درک آنچه مشتری از طریق پردازش زبان طبیعی درخواست میکند، کشف تقلب در کارت اعتباری یا پیشبینی زمان نیاز به تعمیر و نگهداری یک ماشین استفاده شود. صرفنظر از مجموعه داده و هدف مدل ML خاص، همه مدلهای ML یک چیز مشترک دارند: آنها طراحی شدهاند تا پیشبینیها یا تصمیمگیریهایی انجام دهند وقتی با دادههای جدید و نادیدهشده مواجه میشوند، با استفاده از بینشهایی که از اطلاعات موجود در مجموعه داده تاریخی به دست آوردهاند. در حالت ایدهآل، مدلهای ML با گذشت زمان توصیههای خود را بهبود میبخشند، زیرا مدل با دادههای جدید دوباره آموزش میبیند یا با یادگیری اینکه آیا هر پیشبینی یا تصمیم متوالی درست یا نادرست بوده است، سازگار میشود.
انواع مدلهای یادگیری ماشینی
مدلهای یادگیری ماشینی معمولاً بر اساس نوع روش یادگیری — یا الگوریتم یادگیری — که برای آموزش مدل استفاده میشود، دستهبندی میشوند. چهار نوع الگوریتمی وجود دارد، اگرچه گاهی فقط سه دسته استفاده میشود. بیایید آنها را تجزیه کنیم و توضیح دهیم که چگونه متفاوت هستند.
- مدلهای یادگیری نظارتشده
مدلهای یادگیری نظارتشده اکثریت قریب به اتفاق مدلهای ML مورد استفاده در صنعت امروز را تشکیل میدهند، زیرا مستقیمترین و واضحترین موارد استفاده و مزایای تجاری را دارند. یادگیری نظارتشده از دادههای برچسبدار برای آموزش استفاده میکند. این دادههای مقدماتی هستند که قبلاً با خروجی درست برچسبگذاری شدهاند. برای مثال: یک تصویر از یک سیب ممکن است ورودی باشد، خروجی مورد نظر طبقهبندی متنی از نوع خاص میوه خواهد بود. پس از آموزش روی مقدار زیادی از این دادههای برچسبدار، هدف مدل ML نظارتشده این است که سپس یک قطعه داده جدید بدون برچسب (مثلاً، عکسی از یک موز) را بگیرد و از آنچه آموخته است برای کاتالوگ کردن موفقیتآمیز آن استفاده کند. - مدلهای یادگیری بدون نظارت
مدلهای یادگیری بدون نظارت از دادههای آموزشی بدون برچسب استفاده میکنند و خروجی از پیش تعیینشدهای برای مدل ارائه نمیدهند. در مثال بالا، پایگاه داده آموزشی تصاویر هیچ زمینه شناساییای اختصاص دادهشدهای ندارد که مدل بتواند از آن یاد بگیرد. بنابراین، این به مدل بستگی دارد که شباهتها، الگوها و روابط بین آنها را پیدا کند. این معمولاً تکنیک کمتری برای طبقهبندی تصاویر مفید است، اما یادگیری بدون نظارت بیشترین ارزش خود را زمانی پیدا میکند که یک دانشمند داده لزوماً نتیجه نهایی خاصی را در ذهن نداشته باشد. یادگیری بدون نظارت معمولاً برای جستجوی الگوها یا ناهنجاریها در مجموعههای داده بزرگ استفاده میشود — مانند خوشهبندی بیماران پزشکی بر اساس علائم و جمعیتشناسی مشابه برای کشف علت یک بیماری، اطلاعاتی که بهدرستی برچسبگذاری آن غیرممکن است. - مدلهای یادگیری نیمهنظارتشده
نوع کمتر شناختهشده (و نه همیشه شناختهشده) ML، یادگیری نیمهنظارتشده است. این روش ترکیبی از دادههای برچسبدار و بدون برچسب را برای آموزش مدل استفاده میکند و اغلب زمانی دیده میشود که برچسبگذاری هر قطعه داده در یک مجموعه داده بسیار بزرگ — مانند میلیاردها عکس از افراد — غیرممکن باشد. در اینجا، زیرمجموعهای از دادهها برچسبگذاری شده (یا در این مورد، شرح داده شده) و همراه با دادههای بدون برچسب به الگوریتم وارد میشود. تصاویر بدون برچسب در طول آموزش برچسبگذاری میشوند. - مدلهای یادگیری تقویتی
یادگیری تقویتی نوع الگوریتمی است که طراحی شده است تا خود را از طریق آزمون و خطا آموزش دهد. هیچ داده آموزشی رسمی در یادگیری تقویتی استفاده نمیشود؛ مدل اگر کاری درست انجام دهد “پاداش” میگیرد و اگر کاری اشتباه انجام دهد “تنبیه” میشود. با گذشت زمان، مدل برای یافتن راهحل بهینه برای یک مشکل بدون اینکه مستقیماً به آن گفته شود چگونه به آن برسد، سازگار میشود. مدلهای ML از طریق یادگیری تقویتی بازیهای پیچیدهای مانند گو و شطرنج را تسلط یافتهاند، صرفاً با اجرای میلیاردها بازی شبیهسازیشده برای یافتن استراتژی بهینه برای هر حرکت. آموزش خودروهای خودران نمونه بارز دیگری از پیادهسازی یادگیری تقویتی است.
مدلهای یادگیری ماشینی چگونه کار میکنند؟
مدلهای ML از طریق چرخهای طراحی میشوند که معمولاً شامل شش مرحله است. این فرآیند ماهیتاً چرخهای است، که توسط مجموعهای تکرارشونده از مراحل تعریف میشود که بهطور کلی شامل آموزش، آزمایش و استقرار میشود.
- تعریف مسئله
اگر مسئله تجاریای که میخواهید حل کنید نداشته باشید، نمیتوانید (یا حداقل نباید) یک مدل یادگیری ماشینی را آموزش دهید. این میتواند چیزی مانند کاهش تقلب در کارت اعتباری به میزان ۹۰٪ در فروشگاههای شما در عرض ۳ ماه یا کاهش زمان خرابی ماشین به میزان ۱۵٪ در سال آینده باشد. مسئله باید خاص و قابل اندازهگیری — و در یک دوره زمانی مشخص قابل دستیابی باشد. - جمعآوری و آمادهسازی دادهها
با تعریف مسئله، زمان آن است که روی دادههایی که برای حل آن نیاز دارید تمرکز کنید. دادهها را جمعآوری، تلفیق و — مهم — تمیز کنید و به قالبی تبدیل کنید که برای آموزش مدل قابل استفاده باشد. دادههای کثیف که پر از ناسازگاریها، موارد تکراری، دادههای پرت و شکافها هستند، به یک مدل ML ضعیف — و توصیههای ضعیف منجر میشوند. - انتخاب الگوریتم
در این مرحله، زمان آن است که تصمیم بگیرید چه الگوریتمی را برای آموزش مدل خود استفاده خواهید کرد. مجموعهای از الگوریتمها در دسترس هستند، هر کدام برای یک مورد استفاده خاص طراحی شدهاند، همانطور که در بخش قبلی بررسی کردیم. یک دانشمند داده آموزشدیده در کمک به هدایت این تصمیم و تعیین اینکه مدل نهایی باید چگونه به نظر برسد تا سودمندی آن به حداکثر برسد، ارزشمند خواهد بود. - آموزش مدل
با داشتن الگوریتم و داده، زمان آن است که مدل فرآیند آموزش را آغاز کند. یک دانشمند داده این فرآیند را نظارت خواهد کرد، پارامترها را در حین پیشرفت آموزش تنظیم میکند تا زمان آموزش مورد نیاز و تعداد خطاهای تولیدشده در طول آموزش را به حداقل برساند. - ارزیابی
هنگامی که فرآیند آموزش اولیه کامل شد، میتوانید از مدل در یک محیط جعبه شنی استفاده کنید تا اولین نگاه خود را به اینکه چقدر خوب عمل کرده است، به دست آورید. برای این کار، میتوانید مدل را با دادههای جدید و زندهای که مدل هنوز ندیده است، تغذیه کنید. عملکرد مدل را با انتظارات و معیارهایی که در مراحل اولیه پروژه تعیین کردهاید مقایسه کنید. آیا مدل تصاویر جدید را با موفقیت طبقهبندی کرد؟ آیا نسبت مورد نظر تراکنشهای تقلبی را تشخیص داد؟ با استقرار مدل بهعنوان یک پروژه آزمایشی یا اثبات مفهوم، میتوانید ایده اولیهای درباره اینکه آیا به اندازه کافی موفق است که بهصورت زنده اجرا شود یا نیاز به تنظیم دقیق یا آموزش اضافی دارد، به دست آورید. - استقرار و پیشبینی
وقتی راضی شدید که مدل انتظارات را برآورده میکند، میتوانید آن را بهطور کامل در یک محیط تولیدی مستقر کنید. اکنون میتوانید از ارزیابیها و پیشبینیهایی که مدل در این مرحله انجام میدهد برای هدایت تصمیمات تجاری استفاده کنید. با این حال، کار روی مدل تمام نشده است. متخصصان علم داده باید مدل را بهصورت مداوم نظارت کنند تا مطمئن شوند مشکلی ایجاد نمیشود. اینها میتوانند شامل انحراف داده، کاهش عملکرد یا افزایش تدریجی تعصب در نتایج مدل باشند. آموزش مجدد دورهای مدل در برابر تمام دادههای جمعآوریشده (شامل تمام دادههای جدید) معمولاً برای اطمینان از دقت بلندمدت مورد نیاز است، که به این معناست که به مرحله ۴ در چرخه بازگردید و از آنجا ادامه دهید.
نمونههایی از مدلهای یادگیری ماشینی در عمل
مدلهای ML هر روز در برنامههای تجاری و رو به مصرفکننده استفاده میشوند. اینها شامل موارد زیر هستند:
موتورهای توصیه
وقتی یک فروشگاه آنلاین محصولی دیگر را بر اساس چیزی که به سبد خرید خود اضافه کردهاید پیشنهاد میدهد، این ML (معمولاً یادگیری بدون نظارت) در حال کار است.
تشخیص هرزنامه
فیلترهای هرزنامه آموزشدیده با ML میلیاردها پیام معتبر و هرزنامه را بررسی میکنند تا الگوهایی را پیدا کنند که به شناسایی ایمیلهای جعلی کمک میکند.
تقسیمبندی مشتریان
یک کاربرد رایج مدلهای ML در بازاریابی تلاش برای تقسیمبندی مشتریان بر اساس ویژگیهایی است که انسانها نمیتوانند شناسایی کنند اما یک الگوریتم ML میتواند بر اساس تحلیل بسیار عمیقتر دادهها کشف کند. تیمها میتوانند از این اطلاعات برای هدفگذاری محصولات یا تبلیغات جدید بر اساس احتمال خرید مشتریان استفاده کنند.
تشخیص تقلب
مشابه تشخیص هرزنامه، یک مدل ML میتواند تراکنشهای مالی بیشماری را بررسی کند تا آنهایی که به احتمال زیاد تقلبی هستند را پیدا کند — در نهایت بر اساس معیارهایی که مدل بهخودیخود تعیین میکند.
سؤالات متداول مدلهای یادگیری ماشینی تفاوت بین الگوریتم و مدل چیست؟
در یادگیری ماشینی، یک الگوریتم برای آموزش یک مدل استفاده میشود. به عبارت دیگر، مدل خروجی الگوریتم است پس از اینکه آموزش به پایان رسیده است. این مدل آن چیزی است که در نهایت برای تصمیمگیری یا پیشبینی استفاده میشود.
انواع یادگیری در یادگیری ماشینی چیست؟
چهار نوع یادگیری عبارتند از یادگیری نظارتشده، یادگیری بدون نظارت، یادگیری نیمهنظارتشده و یادگیری تقویتی. اینها عمدتاً بر اساس اینکه دادههای مورد استفاده برای آموزش مدل ML برچسبدار، بدون برچسب یا ترکیبی از این دو هستند، متفاوت هستند.
چند نمونه از یادگیری ماشینی چیست؟
یادگیری ماشینی همهجا اطراف ماست. برخی از بارزترین نمونهها شامل: شناسایی تصویر، فیلتر کردن هرزنامه، تشخیص تقلب، تحلیل تصویر پزشکی و کمک به تشخیص، سیستمهای تبدیل گفتار به متن و سیستمهای حملونقل خودکار هستند.
