مدل‌های ML,تصمیم‌گیری هوشمند,یادگیری ماشینی

مدل یادگیری ماشینی (ML) چیست؟

مدل‌های Machine Learning چیستند و چگونه کار می‌کنند؟

مدل‌های یادگیری ماشینی (ML) اجزای هوش مصنوعی هستند که الگوریتم‌های ویژه آموزش‌دیده ایجاد می‌کنند. مدل‌های ML به کامپیوترها امکان می‌دهند پیش‌بینی کنند، اطلاعات را طبقه‌بندی کنند و بینش‌هایی را از داده‌ها کشف کنند بدون اینکه به‌صورت صریح برای این کار برنامه‌ریزی شده باشند. در این مقاله، ما درباره چگونگی ایجاد مدل‌های ML و اینکه چگونه سازمان‌ها می‌توانند از استقرار آن‌ها بهره‌مند شوند، بحث خواهیم کرد.

مدل‌های ML با تحلیل مجموعه‌های داده بزرگ ایجاد می‌شوند، فرآیندی که به‌عنوان آموزش شناخته می‌شود. مجموعه داده‌ای که برای آموزش مدل استفاده می‌شود می‌تواند تقریباً هر چیزی باشد — ساختاریافته، غیرساختاریافته، برچسب‌دار یا بدون برچسب. برای مثال، داده‌های آموزشی می‌توانند شامل مجموعه عظیمی از تصاویر، آرشیوی از مکالمات چت‌بات، سال‌ها تراکنش‌های مالی تاریخی یا داده‌های حسگر تجهیزات کارخانه باشند، برای نام بردن از چند کاربرد رایج. یک مدل ML که روی این مجموعه‌های داده آموزش دیده است ممکن است برای شناسایی و طبقه‌بندی تصاویر جدید، درک آنچه مشتری از طریق پردازش زبان طبیعی درخواست می‌کند، کشف تقلب در کارت اعتباری یا پیش‌بینی زمان نیاز به تعمیر و نگهداری یک ماشین استفاده شود. صرف‌نظر از مجموعه داده و هدف مدل ML خاص، همه مدل‌های ML یک چیز مشترک دارند: آن‌ها طراحی شده‌اند تا پیش‌بینی‌ها یا تصمیم‌گیری‌هایی انجام دهند وقتی با داده‌های جدید و نادیده‌شده مواجه می‌شوند، با استفاده از بینش‌هایی که از اطلاعات موجود در مجموعه داده تاریخی به دست آورده‌اند. در حالت ایده‌آل، مدل‌های ML با گذشت زمان توصیه‌های خود را بهبود می‌بخشند، زیرا مدل با داده‌های جدید دوباره آموزش می‌بیند یا با یادگیری اینکه آیا هر پیش‌بینی یا تصمیم متوالی درست یا نادرست بوده است، سازگار می‌شود.

انواع مدل‌های یادگیری ماشینی

مدل‌های یادگیری ماشینی معمولاً بر اساس نوع روش یادگیری — یا الگوریتم یادگیری — که برای آموزش مدل استفاده می‌شود، دسته‌بندی می‌شوند. چهار نوع الگوریتمی وجود دارد، اگرچه گاهی فقط سه دسته استفاده می‌شود. بیایید آن‌ها را تجزیه کنیم و توضیح دهیم که چگونه متفاوت هستند.

  1. مدل‌های یادگیری نظارت‌شده
    مدل‌های یادگیری نظارت‌شده اکثریت قریب به اتفاق مدل‌های ML مورد استفاده در صنعت امروز را تشکیل می‌دهند، زیرا مستقیم‌ترین و واضح‌ترین موارد استفاده و مزایای تجاری را دارند. یادگیری نظارت‌شده از داده‌های برچسب‌دار برای آموزش استفاده می‌کند. این داده‌های مقدماتی هستند که قبلاً با خروجی درست برچسب‌گذاری شده‌اند. برای مثال: یک تصویر از یک سیب ممکن است ورودی باشد، خروجی مورد نظر طبقه‌بندی متنی از نوع خاص میوه خواهد بود. پس از آموزش روی مقدار زیادی از این داده‌های برچسب‌دار، هدف مدل ML نظارت‌شده این است که سپس یک قطعه داده جدید بدون برچسب (مثلاً، عکسی از یک موز) را بگیرد و از آنچه آموخته است برای کاتالوگ کردن موفقیت‌آمیز آن استفاده کند.
  2. مدل‌های یادگیری بدون نظارت
    مدل‌های یادگیری بدون نظارت از داده‌های آموزشی بدون برچسب استفاده می‌کنند و خروجی از پیش تعیین‌شده‌ای برای مدل ارائه نمی‌دهند. در مثال بالا، پایگاه داده آموزشی تصاویر هیچ زمینه شناسایی‌ای اختصاص داده‌شده‌ای ندارد که مدل بتواند از آن یاد بگیرد. بنابراین، این به مدل بستگی دارد که شباهت‌ها، الگوها و روابط بین آن‌ها را پیدا کند. این معمولاً تکنیک کمتری برای طبقه‌بندی تصاویر مفید است، اما یادگیری بدون نظارت بیشترین ارزش خود را زمانی پیدا می‌کند که یک دانشمند داده لزوماً نتیجه نهایی خاصی را در ذهن نداشته باشد. یادگیری بدون نظارت معمولاً برای جستجوی الگوها یا ناهنجاری‌ها در مجموعه‌های داده بزرگ استفاده می‌شود — مانند خوشه‌بندی بیماران پزشکی بر اساس علائم و جمعیت‌شناسی مشابه برای کشف علت یک بیماری، اطلاعاتی که به‌درستی برچسب‌گذاری آن غیرممکن است.
  3. مدل‌های یادگیری نیمه‌نظارت‌شده
    نوع کمتر شناخته‌شده (و نه همیشه شناخته‌شده) ML، یادگیری نیمه‌نظارت‌شده است. این روش ترکیبی از داده‌های برچسب‌دار و بدون برچسب را برای آموزش مدل استفاده می‌کند و اغلب زمانی دیده می‌شود که برچسب‌گذاری هر قطعه داده در یک مجموعه داده بسیار بزرگ — مانند میلیاردها عکس از افراد — غیرممکن باشد. در اینجا، زیرمجموعه‌ای از داده‌ها برچسب‌گذاری شده (یا در این مورد، شرح داده شده) و همراه با داده‌های بدون برچسب به الگوریتم وارد می‌شود. تصاویر بدون برچسب در طول آموزش برچسب‌گذاری می‌شوند.
  4. مدل‌های یادگیری تقویتی
    یادگیری تقویتی نوع الگوریتمی است که طراحی شده است تا خود را از طریق آزمون و خطا آموزش دهد. هیچ داده آموزشی رسمی در یادگیری تقویتی استفاده نمی‌شود؛ مدل اگر کاری درست انجام دهد “پاداش” می‌گیرد و اگر کاری اشتباه انجام دهد “تنبیه” می‌شود. با گذشت زمان، مدل برای یافتن راه‌حل بهینه برای یک مشکل بدون اینکه مستقیماً به آن گفته شود چگونه به آن برسد، سازگار می‌شود. مدل‌های ML از طریق یادگیری تقویتی بازی‌های پیچیده‌ای مانند گو و شطرنج را تسلط یافته‌اند، صرفاً با اجرای میلیاردها بازی شبیه‌سازی‌شده برای یافتن استراتژی بهینه برای هر حرکت. آموزش خودروهای خودران نمونه بارز دیگری از پیاده‌سازی یادگیری تقویتی است.

مدل‌های یادگیری ماشینی چگونه کار می‌کنند؟

مدل‌های ML از طریق چرخه‌ای طراحی می‌شوند که معمولاً شامل شش مرحله است. این فرآیند ماهیتاً چرخه‌ای است، که توسط مجموعه‌ای تکرارشونده از مراحل تعریف می‌شود که به‌طور کلی شامل آموزش، آزمایش و استقرار می‌شود.

  1. تعریف مسئله
    اگر مسئله تجاری‌ای که می‌خواهید حل کنید نداشته باشید، نمی‌توانید (یا حداقل نباید) یک مدل یادگیری ماشینی را آموزش دهید. این می‌تواند چیزی مانند کاهش تقلب در کارت اعتباری به میزان ۹۰٪ در فروشگاه‌های شما در عرض ۳ ماه یا کاهش زمان خرابی ماشین به میزان ۱۵٪ در سال آینده باشد. مسئله باید خاص و قابل اندازه‌گیری — و در یک دوره زمانی مشخص قابل دستیابی باشد.
  2. جمع‌آوری و آماده‌سازی داده‌ها
    با تعریف مسئله، زمان آن است که روی داده‌هایی که برای حل آن نیاز دارید تمرکز کنید. داده‌ها را جمع‌آوری، تلفیق و — مهم — تمیز کنید و به قالبی تبدیل کنید که برای آموزش مدل قابل استفاده باشد. داده‌های کثیف که پر از ناسازگاری‌ها، موارد تکراری، داده‌های پرت و شکاف‌ها هستند، به یک مدل ML ضعیف — و توصیه‌های ضعیف منجر می‌شوند.
  3. انتخاب الگوریتم
    در این مرحله، زمان آن است که تصمیم بگیرید چه الگوریتمی را برای آموزش مدل خود استفاده خواهید کرد. مجموعه‌ای از الگوریتم‌ها در دسترس هستند، هر کدام برای یک مورد استفاده خاص طراحی شده‌اند، همان‌طور که در بخش قبلی بررسی کردیم. یک دانشمند داده آموزش‌دیده در کمک به هدایت این تصمیم و تعیین اینکه مدل نهایی باید چگونه به نظر برسد تا سودمندی آن به حداکثر برسد، ارزشمند خواهد بود.
  4. آموزش مدل
    با داشتن الگوریتم و داده، زمان آن است که مدل فرآیند آموزش را آغاز کند. یک دانشمند داده این فرآیند را نظارت خواهد کرد، پارامترها را در حین پیشرفت آموزش تنظیم می‌کند تا زمان آموزش مورد نیاز و تعداد خطاهای تولیدشده در طول آموزش را به حداقل برساند.
  5. ارزیابی
    هنگامی که فرآیند آموزش اولیه کامل شد، می‌توانید از مدل در یک محیط جعبه شنی استفاده کنید تا اولین نگاه خود را به اینکه چقدر خوب عمل کرده است، به دست آورید. برای این کار، می‌توانید مدل را با داده‌های جدید و زنده‌ای که مدل هنوز ندیده است، تغذیه کنید. عملکرد مدل را با انتظارات و معیارهایی که در مراحل اولیه پروژه تعیین کرده‌اید مقایسه کنید. آیا مدل تصاویر جدید را با موفقیت طبقه‌بندی کرد؟ آیا نسبت مورد نظر تراکنش‌های تقلبی را تشخیص داد؟ با استقرار مدل به‌عنوان یک پروژه آزمایشی یا اثبات مفهوم، می‌توانید ایده اولیه‌ای درباره اینکه آیا به اندازه کافی موفق است که به‌صورت زنده اجرا شود یا نیاز به تنظیم دقیق یا آموزش اضافی دارد، به دست آورید.
  6. استقرار و پیش‌بینی
    وقتی راضی شدید که مدل انتظارات را برآورده می‌کند، می‌توانید آن را به‌طور کامل در یک محیط تولیدی مستقر کنید. اکنون می‌توانید از ارزیابی‌ها و پیش‌بینی‌هایی که مدل در این مرحله انجام می‌دهد برای هدایت تصمیمات تجاری استفاده کنید. با این حال، کار روی مدل تمام نشده است. متخصصان علم داده باید مدل را به‌صورت مداوم نظارت کنند تا مطمئن شوند مشکلی ایجاد نمی‌شود. این‌ها می‌توانند شامل انحراف داده، کاهش عملکرد یا افزایش تدریجی تعصب در نتایج مدل باشند. آموزش مجدد دوره‌ای مدل در برابر تمام داده‌های جمع‌آوری‌شده (شامل تمام داده‌های جدید) معمولاً برای اطمینان از دقت بلندمدت مورد نیاز است، که به این معناست که به مرحله ۴ در چرخه بازگردید و از آنجا ادامه دهید.

نمونه‌هایی از مدل‌های یادگیری ماشینی در عمل

مدل‌های ML هر روز در برنامه‌های تجاری و رو به مصرف‌کننده استفاده می‌شوند. این‌ها شامل موارد زیر هستند:

موتورهای توصیه

وقتی یک فروشگاه آنلاین محصولی دیگر را بر اساس چیزی که به سبد خرید خود اضافه کرده‌اید پیشنهاد می‌دهد، این ML (معمولاً یادگیری بدون نظارت) در حال کار است.

تشخیص هرزنامه

فیلترهای هرزنامه آموزش‌دیده با ML میلیاردها پیام معتبر و هرزنامه را بررسی می‌کنند تا الگوهایی را پیدا کنند که به شناسایی ایمیل‌های جعلی کمک می‌کند.

تقسیم‌بندی مشتریان

یک کاربرد رایج مدل‌های ML در بازاریابی تلاش برای تقسیم‌بندی مشتریان بر اساس ویژگی‌هایی است که انسان‌ها نمی‌توانند شناسایی کنند اما یک الگوریتم ML می‌تواند بر اساس تحلیل بسیار عمیق‌تر داده‌ها کشف کند. تیم‌ها می‌توانند از این اطلاعات برای هدف‌گذاری محصولات یا تبلیغات جدید بر اساس احتمال خرید مشتریان استفاده کنند.

تشخیص تقلب

مشابه تشخیص هرزنامه، یک مدل ML می‌تواند تراکنش‌های مالی بی‌شماری را بررسی کند تا آن‌هایی که به احتمال زیاد تقلبی هستند را پیدا کند — در نهایت بر اساس معیارهایی که مدل به‌خودی‌خود تعیین می‌کند.

سؤالات متداول مدل‌های یادگیری ماشینی تفاوت بین الگوریتم و مدل چیست؟

در یادگیری ماشینی، یک الگوریتم برای آموزش یک مدل استفاده می‌شود. به عبارت دیگر، مدل خروجی الگوریتم است پس از اینکه آموزش به پایان رسیده است. این مدل آن چیزی است که در نهایت برای تصمیم‌گیری یا پیش‌بینی استفاده می‌شود.

انواع یادگیری در یادگیری ماشینی چیست؟

چهار نوع یادگیری عبارتند از یادگیری نظارت‌شده، یادگیری بدون نظارت، یادگیری نیمه‌نظارت‌شده و یادگیری تقویتی. این‌ها عمدتاً بر اساس اینکه داده‌های مورد استفاده برای آموزش مدل ML برچسب‌دار، بدون برچسب یا ترکیبی از این دو هستند، متفاوت هستند.

چند نمونه از یادگیری ماشینی چیست؟

یادگیری ماشینی همه‌جا اطراف ماست. برخی از بارزترین نمونه‌ها شامل: شناسایی تصویر، فیلتر کردن هرزنامه، تشخیص تقلب، تحلیل تصویر پزشکی و کمک به تشخیص، سیستم‌های تبدیل گفتار به متن و سیستم‌های حمل‌ونقل خودکار هستند.

هوش مصنوعی پیش‌بین برای کسب‌وکار چیست؟
مهندسی داده (Data Engineering) چیست؟

دیدگاهتان را بنویسید

سبد خرید
علاقه‌مندی‌ها
مشاهدات اخیر
دسته بندی ها