نکات کلیدی
-
ابتکارهای متنباز در دموکراتیککردن فناوری هوش مصنوعی نقش محوری دارند و ابزارهای شفاف و قابلگسترش ارائه میدهند که کاربران را توانمند میکند.
-
جامعه متنباز بهسرعت پژوهشهای جدید را به ابزارهای عملی هوش مصنوعی تبدیل میکند و آنها را قویتر و مفیدتر میسازد.
-
تقطیر مدلهای زبانی بزرگ در طول توسعه، امکان ساخت مدلهای دقیق، سریع و خصوصیِ مخصوصِ وظیفه را فراهم میکند و وابستگی به APIهای عمومی را کاهش میدهد.
-
مقرراتگذاری مؤثر باید میان کاربردهای هوش مصنوعیِ روبهانسان و مؤلفههای زیربناییِ روبهماشین تمایز قائل شود؛ بهگونهای که هم نوآوری حفظ شود و هم نگرانیها درباره حریم خصوصی داده، امنیت، و دسترسی منصفانه رسیدگی گردد.
نقطه مقابلِ متنباز
برخلاف این نگرانی، نرمافزار متنباز در حال برهمزدن تصورِ کنترل انحصاری در هوش مصنوعی است. ابتکارهای متنباز تضمین میکنند که هیچ موجودیت واحدی نتواند چشمانداز هوش مصنوعی را در دست بگیرد. نرمافزار متنباز مزیتهای فراوانی دارد که آن را برای هم افراد و هم شرکتها به گزینهای جذاب تبدیل میکند:
-
شفاف: نرمافزار متنباز شفاف است و به شما اجازه میدهد دقیقاً ببینید چه چیزی دریافت میکنید.
-
بدون قفلشدن: شما به یک فروشنده خاص قفل نمیشوید. هرچند مقداری تعهد وجود دارد، اما هرگز دسترسیتان را از دست نمیدهید.
-
قابل اجرا در داخل سازمان: نرمافزار متنباز میتواند در داخل سازمان اجرا شود؛ چیزی که حیاتی است اگر با دادههای خصوصی کار میکنید و ترجیح میدهید آنها را به سرورهای بیرونی نفرستید.
-
بازبینیشده توسط جامعه: جنبه بازبینی توسط جامعه یعنی میتوانید ببینید چه چیزی محبوب است و چه کسی از چه چیزی استفاده میکند؛ و این سطحی از اعتماد و قابلیت اتکا را تضمین میکند.
-
بهروز: پروژههای متنباز اغلب بهروز هستند و تازهترین پژوهشها را از طریق pull requestها و مشارکتهای جامعه وارد میکنند.
-
برنامهپذیر: نرمافزار بسیار برنامهپذیر است، بهندرت نیازمند یک راهکار سرتاسری است، و میتواند با سهولت در فرایندهای موجود یکپارچه شود.
-
شروع آسان: شروع با نرمافزار متنباز آسان است؛ میتوانید صرفاً از دستورهایی مثل
pip installاستفاده کنید تا دانلود کنید و آغاز کنید. -
قابل گسترش: نرمافزار قابل گسترش است و اگر لازم باشد میتوانید آن را fork کنید و خودتان اجرا کنید.
بُعد اقتصادیِ متنباز
یک بدفهمی رایج درباره نرمافزار متنباز این است که شرکتها عمدتاً آن را انتخاب میکنند چون رایگان است. در حالی که بسیاری از پروژههای متنباز بهصورت رایگان در دسترساند، ارزش واقعی در دسترسبودن و آزادیای است که ارائه میدهند. در حالی که عامل هزینه به پذیرش اولیه کمک میکند، دلیلهای قانعکننده فراوانی پشت سلطه راهکارهای متنباز وجود دارد.
متنباز در هوش مصنوعی و یادگیری ماشین فقط درباره نرمافزار نیست، درباره همافزاییِ کد و داده است. زیستبوم روبهرشدِ مدلهای متنباز همهچیز را از کد تا داده و وزنها در بر میگیرد و ابزارهای قدرتمند را بهطور گسترده در دسترس قرار میدهد. برای روشنکردن چشمانداز، بیایید این مدلها را به سه نوع دستهبندی کنیم:
-
مدلهای مخصوصِ وظیفه (Task-Specific Models): اینها مدلهای تخصصی هستند که برای وظیفههای مشخص طراحی شدهاند. نمونهها شامل مدلهایی میشود که همراه spaCy و پروژههای جامعهاش توزیع میشوند، مدلهایی برای کتابخانه Stanza متعلق به Stanford، و همچنین مدلهای فراوان روی سکوهایی مثل Hugging Face. این مدلها معمولاً کوچک، سریع، و کمهزینه برای اجرا هستند. اما همیشه خوب تعمیم نمیدهند و اغلب نیازمند ریزتنظیم با دادههای مخصوصِ دامنه هستند.
-
مدلهای رمزگذار (Encoder Models): این مدلها، مثل BERT گوگل و گونههای مختلفش، برای تولید بردارهای تعبیه استفاده میشوند که میتوانند مدلهای مخصوصِ وظیفه را تقویت کنند. آنها نسبتاً کوچک، سریع، و مقرونبهصرفه برای اجرا در داخل سازمان هستند، تعمیم بهتری نسبت به مدلهای مخصوصِ وظیفه دارند، اما همچنان برای کاربردهای مشخص به مقداری ریزتنظیم نیاز دارند.
-
مدلهای مولد بزرگ (Large Generative Models): این دسته شامل مدلهایی مثل Falcon، Mistral و LLaMA است. این مدلها بهطور چشمگیر بزرگتر، کندتر، و گرانتر برای اجرا هستند، اما در تعمیم و سازگاری عالیاند و برای انجام وظیفههای مشخص به ریزتنظیم کم یا حتی هیچ ریزتنظیمی نیاز ندارند.
برداشت اشتباه از مدلهای زبانی بزرگ
اصطلاح «مدلهای زبانی بزرگ» (LLMs) اغلب بهصورت گسترده و غیر دقیق استفاده میشود و بحثها درباره توانمندیها و کاربردهایشان را گلآلود میکند. بنابراین تمایز میان مدلهای رمزگذار و مدلهای مولد بزرگ بسیار مهم است. مدلهای رمزگذار شامل شبکههای مخصوصِ وظیفه هستند که داده ساختیافته را پیشبینی میکنند، در حالی که مدلهای مولد بزرگ بر تکیه بر دستورها (prompts) برای تولید متن آزاد (free-form) متکیاند و برای استخراج بینشهای قابل اقدام، به منطق اضافی نیاز دارند.
نقش صرفهجوییهای مقیاس
مدلهای مولد بزرگ، به دلیل پیچیدگی و هزینه عملیاتیشان، اغلب از طریق APIهایی که شرکتهایی مثل OpenAI و Google ارائه میدهند در دسترس قرار میگیرند. این شرکتها از صرفهجوییهای مقیاس بهره میبرند: دسترسی به بهترین استعدادها، منابع محاسباتی عمدهفروشی، و حجم بالای درخواستها که دستهبندی کارآمد را ممکن میکند. این سازوکار شبیه برنامه حرکت قطار در یک شهر شلوغ عمل میکند: چون تقاضا بالاست، ارائه سرویس پرتکرار شدنی و مقرونبهصرفه میشود.
تمایز میان هوش مصنوعیِ روبهانسان و روبهماشین
یک تمایز حیاتی در چشمانداز هوش مصنوعی میان سیستمهای روبهانسان و مدلهای روبهماشین است. برای سیستمهای روبهانسان، مثل ChatGPT و Google Gemini، مهمترین تمایز ویژگیهای محصول است؛ از جمله تجربه کاربر، رابطهای کاربری، و شخصیسازی، که اغلب محدودیتهایی برای جلوگیری از خروجیهای نامطلوب هم دارند. این محصولات مستقیماً با کاربران تعامل میکنند و برای بهبود و پالایش قابلیتهایشان بهشدت به دادههای کاربر تکیه دارند. در مقابل، مدلهای زیربنایی مثل GPT-4 و Bard مؤلفههایی در یک سیستم بزرگتر هستند و ستون فقرات این برنامههای روبهمصرفکننده را شکل میدهند. مدلهای روبهماشین مؤلفههای قابلجایگزینی هستند که بر پژوهش و دادههای منتشرشده عمومی بنا شدهاند، و کاراییشان با معیارهایی مثل سرعت، دقت، تأخیر، و هزینه سنجیده میشود.
فهمیدن تفاوتهای میان این نوع کاربردهای هوش مصنوعی ضروری است. این تمایز به روشنشدن بدفهمیها درباره انحصاریکردن هوش مصنوعی کمک میکند. شرکتهایی مثل OpenAI ممکن است بازار محصولات روبهکاربر را در دست بگیرند، اما نه لزوماً مؤلفههای هوش مصنوعی و نرمافزار پشت آنها را. در حالی که داده کاربر برای بهبود محصولات روبهانسان مزیت است، برای بهبود وظیفههای بنیادیِ روبهماشین کمتر حیاتی است. کسب دانش عمومی به دادههای خاص نیاز ندارد، و این در مرکز نوآوری پشت مدلهای مولد بزرگ قرار دارد.
توانمندیهای هوش مصنوعی در عمل
توانمندیهای هوش مصنوعی در عمل میتواند بهطور کلی به وظیفههای مولد و پیشبینانه دستهبندی شود:
-
وظیفههای مولد: خلاصهسازی، استدلال، حل مسئله، پاسخگویی به پرسش، بازنویسی، و انتقال سبک، توانمندیهای جدیدی هستند که مدلهای مولد ممکن کردهاند.
-
وظیفههای پیشبینانه: دستهبندی متن، تشخیص موجودیت، استخراج رابطه، حل همارجاعی، دستور و ساختواژه، تجزیه معنایی، و ساختار گفتمان. این وظیفهها شامل تبدیل متن بدون ساختار به بازنماییهای ساختیافته است که سپس در کاربردهای مختلف استفاده میشود.
در حالی که هوش مصنوعی مولد امکانهای جدید فراوانی ارائه میدهد، بسیاری از چالشهای صنعت همانها باقی ماندهاند، و عمدتاً روی ساختیافتهکردن دادههای بدون ساختار مثل زبان متمرکزند. ظهور هوش مصنوعی اجازه میدهد این مسئلهها را کارآمدتر و در مقیاس بزرگتر حل کنیم، و تولید داده ساختیافته و تکمیل پروژهها را ممکنتر کنیم.
تکاملِ گفتن به کامپیوتر که چه کار کند
فرایند دستور دادن به کامپیوترها در چندین تکرار تکامل پیدا کرده است:
-
سیستمهای مبتنی بر قواعد (Rule-Based Systems): در ابتدا، ما قواعد یا دستورها را با منطق شرطی و عبارتهای منظم ارائه میکردیم.
-
یادگیری ماشین (Machine Learning): برنامهنویسی با مثال را معرفی کرد، که به آن یادگیری نظارتشده هم گفته میشود، جایی که مدلها با مثالهای مشخص آموزش داده میشوند.
-
یادگیری در متن (In-Context Learning): جدیدتر، ارائه قواعد و دستورها به شکل زبان طبیعی.
هر روش مزایا و معایب خودش را دارد. دستورها شهودی و برای غیرمتخصصان آساناند، اما میتوانند در برابر رانش داده آسیبپذیر باشند. مثالها بسیار دقیقاند و میتوانند رفتارهای ظریف را بیان کنند، اما تولیدشان پرزحمت است. پس یک گردشکار چگونه میتواند باشد که هر دو روش را ترکیب کند و با استفاده از مدلهای بزرگ عمومی و دادههای مشخص، مدلهای متمرکزِ مخصوصِ وظیفه توسعه دهد؟
کاربردهای عملی و یادگیری انتقالی
یک گردشکار عملی هوش مصنوعی شامل ارزیابی و اصلاح پیشبینیهای مدل بهصورت تکرارشونده است، با استفاده از یادگیری انتقالی برای تقطیر مدلهای عمومی به مدلهای مشخص. یادگیری انتقالی برای کاربردهای عملی همچنان مرتبط است و راهکارهایی ماژولار، قابل تفسیر، و مقرونبهصرفه فراهم میکند.
استفاده از مدلهای مولد بزرگ به حل مشکل شروع سرد کمک میکند و اجازه میدهد نمونههای اولیه از همان ابتدا کار کنند. این نمونهها سپس میتوانند پالایش و به مدلهای کوچکتر، سریعتر، و مشخصتر تقطیر شوند. این رویکرد از فرایند پرزحمت تولید مثالها از صفر پرهیز میکند و وابستگی به مدلهای عظیم و پیچیده در زمان اجرا را کاهش میدهد.
تقطیرِ مدلهای مخصوصِ وظیفه با انسان در حلقه
توسعه مدلهای تقطیرشده مخصوصِ وظیفه با بهترین شیوههای نرمافزار همراستا است و مزیتهای فراوانی ارائه میدهد:
-
ماژولار: رویکرد بسیار ماژولار است و با بهترین شیوههای توسعه نرمافزار همراستا است. این اجازه میدهد گردشکارهای مدرن حفظ شوند و توسعه مدل متناسب با آنها سازگار شود.
-
بدون قفلشدن: کاربران به هیچ ارائهدهنده مشخصی بسته نمیشوند. مدلها میتوانند با ارائهدهندههای مختلف توسعه پیدا کنند، اما در زمان اجرا میتوانند مستقل مالکیت و مدیریت شوند.
-
قابل آزمون: مؤلفهها میتوانند بهصورت جداگانه آزموده شوند، و در مقایسه با یک سیستم تکِ جعبهسیاه، پایش و تشخیص شکستها آسانتر میشود.
-
انعطافپذیر و ارزان برای اجرا: مدلها مؤلفههای انعطافپذیر در یک سیستم هستند و میتوانند بهینه شوند تا کارآمد اجرا شوند، حتی روی CPUها یا با ردپای کوچک، و هزینههای عملیاتی را بهطور چشمگیر کاهش دهند.
-
قابل اجرا در داخل سازمان: برای مدیریت امن دادههای حساس بدون تکیه بر APIهای بیرونی حیاتی است، و حریم خصوصی داده و انطباق مقرراتی را تضمین میکند.
-
شفاف و قابل پیشبینی: کاربران دیدپذیری نسبت به شیوه کار مدلها دارند، که به فهم بهتر و پیشبینیپذیری رفتار مدل کمک میکند.
-
برنامهپذیر: مدلها میتوانند بهصورت برنامهای در گردشکارهای موجود یکپارچه شوند، با نیازهای کسبوکار همراستا شوند، و چالشهای یکپارچهسازی را کمینه کنند.
اینها همان دلیلهایی هستند که شرکتها نرمافزار متنباز را انتخاب میکنند، که تصادفی نیست: توسعه هوش مصنوعی هنوز نوعی توسعه نرمافزار است و همان اصول اعمال میشود.
رسیدگی به نگرانیها و مقرراتگذاری
صرفهجوییهای مقیاس، که زمانی برای سلطه انحصاری حیاتی فرض میشد، در فناوری با چالش روبهرو است، چون رقابت شدید هزینهها را پایین میکشد. توانایی تکیه بر مدلهای متنباز که در غیر این صورت گراناند در مرحله توسعه بهجای مرحله تولید، این «خندق دفاعی» را حتی کماهمیتتر میکند.
مقرراتگذاری بهعنوان راهبرد دیگری ظاهر میشود که شرکتهای بزرگ فناوری برای حفظ انحصار در این حوزه دنبال میکنند، و در سراسر جهان دولتها را لابی میکنند تا قوانین هوش مصنوعی تصویب شود که فقط خودشان بتوانند از عهده انطباق با آن برآیند.
حفظ شفافیت در مقرراتگذاری برای اطمینان از اینکه هوش مصنوعی بدون کنترل انحصاری تکامل پیدا کند ضروری است. با مرزبندی میان کاربردها و فناوریهای هستهای، سیاستگذاران میتوانند چشماندازی رقابتی ایجاد کنند که نوآوری را تشویق کند و همزمان از منافع مصرفکننده محافظت کند. این تمایز در هدایت هوش مصنوعی به سمت آیندهای از نوآوری و دسترسیپذیری حیاتی است، جایی که هیچ موجودیت واحدی نفوذ ناموجه در بازار نداشته باشد.
نتیجهگیریها
چشمانداز توسعه و استقرار هوش مصنوعی بیشتر با شفافیت و دسترسیپذیری تعریف میشود تا مزیتهای پنهانکارانه. در قلمرو مدلهای زبانی بزرگ (LLMs)، که مؤلفههای یکپارچه هستند نه محصولات مستقل، هیچ مزیت ذاتی برای ساختن انحصار از دانش اختصاصی یا دسترسی انحصاری به داده وجود ندارد.
این مدلها میتوانند بهطور مؤثر با روشهای دیگر جایگزین شوند یا در کنار آنها به کار گرفته شوند، و این، همکنشپذیری و رقابت را تقویت میکند، یعنی درست خلاف انحصار. نرمافزار متنباز نقش مهمی در تضمین این انعطافپذیری دارد و نوآوری را از طریق توسعه مشارکتی و موشکافی جامعه ترویج میکند.
با این حال، احتمال اینکه تدابیر مقرراتی ناخواسته به نفع رفتارهای انحصاری تمام شود همچنان یک نگرانی است. برای جلوگیری از این، مقررات باید روی تنظیم رفتارها و موارد استفاده تمرکز کند، نه هدفگرفتن فناوریهای مشخص یا مؤلفههای نرمافزاری خاص.
این رویکرد متعادل برای حفظ یک محیط رقابتی و فراگیر در توسعه هوش مصنوعی ضروری است. همچنین از نفوذ ناموجه تلاشهای لابیگری صنعتی که ممکن است بخواهند چارچوبهای مقرراتی را برای منفعت خودشان منحرف کنند دوری میکند.
