نکات کلیدی

ابتکارهای متن‌باز در دموکراتیک‌کردن فناوری هوش مصنوعی نقش محوری دارند و ابزارهای شفاف و قابل‌گسترش ارائه می‌دهند که کاربران را توانمند می‌کند.
جامعه متن‌باز به‌سرعت پژوهش‌های جدید را به ابزارهای عملی هوش مصنوعی تبدیل می‌کند و آن‌ها را قوی‌تر و مفیدتر می‌سازد.
تقطیر مدل‌های زبانی بزرگ در طول توسعه، امکان ساخت مدل‌های دقیق، سریع و خصوصیِ مخصوصِ وظیفه را فراهم می‌کند و وابستگی به APIهای عمومی را کاهش می‌دهد.
مقررات‌گذاری مؤثر باید میان کاربردهای هوش مصنوعیِ رو‌به‌انسان و مؤلفه‌های زیربناییِ رو‌به‌ماشین تمایز قائل شود؛ به‌گونه‌ای که هم نوآوری حفظ شود و هم نگرانی‌ها درباره حریم خصوصی داده، امنیت، و دسترسی منصفانه رسیدگی گردد.

نقطه مقابلِ متن‌باز

برخلاف این نگرانی، نرم‌افزار متن‌باز در حال برهم‌زدن تصورِ کنترل انحصاری در هوش مصنوعی است. ابتکارهای متن‌باز تضمین می‌کنند که هیچ موجودیت واحدی نتواند چشم‌انداز هوش مصنوعی را در دست بگیرد. نرم‌افزار متن‌باز مزیت‌های فراوانی دارد که آن را برای هم افراد و هم شرکت‌ها به گزینه‌ای جذاب تبدیل می‌کند:

شفاف: نرم‌افزار متن‌باز شفاف است و به شما اجازه می‌دهد دقیقاً ببینید چه چیزی دریافت می‌کنید.
بدون قفل‌شدن: شما به یک فروشنده خاص قفل نمی‌شوید. هرچند مقداری تعهد وجود دارد، اما هرگز دسترسی‌تان را از دست نمی‌دهید.
قابل اجرا در داخل سازمان: نرم‌افزار متن‌باز می‌تواند در داخل سازمان اجرا شود؛ چیزی که حیاتی است اگر با داده‌های خصوصی کار می‌کنید و ترجیح می‌دهید آن‌ها را به سرورهای بیرونی نفرستید.
بازبینی‌شده توسط جامعه: جنبه بازبینی توسط جامعه یعنی می‌توانید ببینید چه چیزی محبوب است و چه کسی از چه چیزی استفاده می‌کند؛ و این سطحی از اعتماد و قابلیت اتکا را تضمین می‌کند.
به‌روز: پروژه‌های متن‌باز اغلب به‌روز هستند و تازه‌ترین پژوهش‌ها را از طریق pull requestها و مشارکت‌های جامعه وارد می‌کنند.
برنامه‌پذیر: نرم‌افزار بسیار برنامه‌پذیر است، به‌ندرت نیازمند یک راهکار سرتاسری است، و می‌تواند با سهولت در فرایندهای موجود یکپارچه شود.
شروع آسان: شروع با نرم‌افزار متن‌باز آسان است؛ می‌توانید صرفاً از دستورهایی مثل pip install استفاده کنید تا دانلود کنید و آغاز کنید.
قابل گسترش: نرم‌افزار قابل گسترش است و اگر لازم باشد می‌توانید آن را fork کنید و خودتان اجرا کنید.

بُعد اقتصادیِ متن‌باز

یک بدفهمی رایج درباره نرم‌افزار متن‌باز این است که شرکت‌ها عمدتاً آن را انتخاب می‌کنند چون رایگان است. در حالی که بسیاری از پروژه‌های متن‌باز به‌صورت رایگان در دسترس‌اند، ارزش واقعی در دسترس‌بودن و آزادی‌ای است که ارائه می‌دهند. در حالی که عامل هزینه به پذیرش اولیه کمک می‌کند، دلیل‌های قانع‌کننده فراوانی پشت سلطه راهکارهای متن‌باز وجود دارد.

متن‌باز در هوش مصنوعی و یادگیری ماشین فقط درباره نرم‌افزار نیست، درباره هم‌افزاییِ کد و داده است. زیست‌بوم رو‌به‌رشدِ مدل‌های متن‌باز همه‌چیز را از کد تا داده و وزن‌ها در بر می‌گیرد و ابزارهای قدرتمند را به‌طور گسترده در دسترس قرار می‌دهد. برای روشن‌کردن چشم‌انداز، بیایید این مدل‌ها را به سه نوع دسته‌بندی کنیم:

مدل‌های مخصوصِ وظیفه (Task-Specific Models): این‌ها مدل‌های تخصصی هستند که برای وظیفه‌های مشخص طراحی شده‌اند. نمونه‌ها شامل مدل‌هایی می‌شود که همراه spaCy و پروژه‌های جامعه‌اش توزیع می‌شوند، مدل‌هایی برای کتابخانه Stanza متعلق به Stanford، و همچنین مدل‌های فراوان روی سکوهایی مثل Hugging Face. این مدل‌ها معمولاً کوچک، سریع، و کم‌هزینه برای اجرا هستند. اما همیشه خوب تعمیم نمی‌دهند و اغلب نیازمند ریزتنظیم با داده‌های مخصوصِ دامنه هستند.
مدل‌های رمزگذار (Encoder Models): این مدل‌ها، مثل BERT گوگل و گونه‌های مختلفش، برای تولید بردارهای تعبیه استفاده می‌شوند که می‌توانند مدل‌های مخصوصِ وظیفه را تقویت کنند. آن‌ها نسبتاً کوچک، سریع، و مقرون‌به‌صرفه برای اجرا در داخل سازمان هستند، تعمیم بهتری نسبت به مدل‌های مخصوصِ وظیفه دارند، اما همچنان برای کاربردهای مشخص به مقداری ریزتنظیم نیاز دارند.
مدل‌های مولد بزرگ (Large Generative Models): این دسته شامل مدل‌هایی مثل Falcon، Mistral و LLaMA است. این مدل‌ها به‌طور چشمگیر بزرگ‌تر، کندتر، و گران‌تر برای اجرا هستند، اما در تعمیم و سازگاری عالی‌اند و برای انجام وظیفه‌های مشخص به ریزتنظیم کم یا حتی هیچ ریزتنظیمی نیاز ندارند.

برداشت اشتباه از مدل‌های زبانی بزرگ

اصطلاح «مدل‌های زبانی بزرگ» (LLMs) اغلب به‌صورت گسترده و غیر دقیق استفاده می‌شود و بحث‌ها درباره توانمندی‌ها و کاربردهایشان را گل‌آلود می‌کند. بنابراین تمایز میان مدل‌های رمزگذار و مدل‌های مولد بزرگ بسیار مهم است. مدل‌های رمزگذار شامل شبکه‌های مخصوصِ وظیفه هستند که داده ساخت‌یافته را پیش‌بینی می‌کنند، در حالی که مدل‌های مولد بزرگ بر تکیه بر دستورها (prompts) برای تولید متن آزاد (free-form) متکی‌اند و برای استخراج بینش‌های قابل اقدام، به منطق اضافی نیاز دارند.

نقش صرفه‌جویی‌های مقیاس

مدل‌های مولد بزرگ، به دلیل پیچیدگی و هزینه عملیاتی‌شان، اغلب از طریق APIهایی که شرکت‌هایی مثل OpenAI و Google ارائه می‌دهند در دسترس قرار می‌گیرند. این شرکت‌ها از صرفه‌جویی‌های مقیاس بهره می‌برند: دسترسی به بهترین استعدادها، منابع محاسباتی عمده‌فروشی، و حجم بالای درخواست‌ها که دسته‌بندی کارآمد را ممکن می‌کند. این سازوکار شبیه برنامه حرکت قطار در یک شهر شلوغ عمل می‌کند: چون تقاضا بالاست، ارائه سرویس پرتکرار شدنی و مقرون‌به‌صرفه می‌شود.

تمایز میان هوش مصنوعیِ رو‌به‌انسان و رو‌به‌ماشین

یک تمایز حیاتی در چشم‌انداز هوش مصنوعی میان سیستم‌های رو‌به‌انسان و مدل‌های رو‌به‌ماشین است. برای سیستم‌های رو‌به‌انسان، مثل ChatGPT و Google Gemini، مهم‌ترین تمایز ویژگی‌های محصول است؛ از جمله تجربه کاربر، رابط‌های کاربری، و شخصی‌سازی، که اغلب محدودیت‌هایی برای جلوگیری از خروجی‌های نامطلوب هم دارند. این محصولات مستقیماً با کاربران تعامل می‌کنند و برای بهبود و پالایش قابلیت‌هایشان به‌شدت به داده‌های کاربر تکیه دارند. در مقابل، مدل‌های زیربنایی مثل GPT-4 و Bard مؤلفه‌هایی در یک سیستم بزرگ‌تر هستند و ستون فقرات این برنامه‌های رو‌به‌مصرف‌کننده را شکل می‌دهند. مدل‌های رو‌به‌ماشین مؤلفه‌های قابل‌جایگزینی هستند که بر پژوهش و داده‌های منتشرشده عمومی بنا شده‌اند، و کارایی‌شان با معیارهایی مثل سرعت، دقت، تأخیر، و هزینه سنجیده می‌شود.

فهمیدن تفاوت‌های میان این نوع کاربردهای هوش مصنوعی ضروری است. این تمایز به روشن‌شدن بدفهمی‌ها درباره انحصاری‌کردن هوش مصنوعی کمک می‌کند. شرکت‌هایی مثل OpenAI ممکن است بازار محصولات رو‌به‌کاربر را در دست بگیرند، اما نه لزوماً مؤلفه‌های هوش مصنوعی و نرم‌افزار پشت آن‌ها را. در حالی که داده کاربر برای بهبود محصولات رو‌به‌انسان مزیت است، برای بهبود وظیفه‌های بنیادیِ رو‌به‌ماشین کمتر حیاتی است. کسب دانش عمومی به داده‌های خاص نیاز ندارد، و این در مرکز نوآوری پشت مدل‌های مولد بزرگ قرار دارد.

توانمندی‌های هوش مصنوعی در عمل

توانمندی‌های هوش مصنوعی در عمل می‌تواند به‌طور کلی به وظیفه‌های مولد و پیش‌بینانه دسته‌بندی شود:

وظیفه‌های مولد: خلاصه‌سازی، استدلال، حل مسئله، پاسخ‌گویی به پرسش، بازنویسی، و انتقال سبک، توانمندی‌های جدیدی هستند که مدل‌های مولد ممکن کرده‌اند.
وظیفه‌های پیش‌بینانه: دسته‌بندی متن، تشخیص موجودیت، استخراج رابطه، حل هم‌ارجاعی، دستور و ساخت‌واژه، تجزیه معنایی، و ساختار گفتمان. این وظیفه‌ها شامل تبدیل متن بدون ساختار به بازنمایی‌های ساخت‌یافته است که سپس در کاربردهای مختلف استفاده می‌شود.

در حالی که هوش مصنوعی مولد امکان‌های جدید فراوانی ارائه می‌دهد، بسیاری از چالش‌های صنعت همان‌ها باقی مانده‌اند، و عمدتاً روی ساخت‌یافته‌کردن داده‌های بدون ساختار مثل زبان متمرکزند. ظهور هوش مصنوعی اجازه می‌دهد این مسئله‌ها را کارآمدتر و در مقیاس بزرگ‌تر حل کنیم، و تولید داده ساخت‌یافته و تکمیل پروژه‌ها را ممکن‌تر کنیم.

تکاملِ گفتن به کامپیوتر که چه کار کند

فرایند دستور دادن به کامپیوترها در چندین تکرار تکامل پیدا کرده است:

سیستم‌های مبتنی بر قواعد (Rule-Based Systems): در ابتدا، ما قواعد یا دستورها را با منطق شرطی و عبارت‌های منظم ارائه می‌کردیم.
یادگیری ماشین (Machine Learning): برنامه‌نویسی با مثال را معرفی کرد، که به آن یادگیری نظارت‌شده هم گفته می‌شود، جایی که مدل‌ها با مثال‌های مشخص آموزش داده می‌شوند.
یادگیری در متن (In-Context Learning): جدیدتر، ارائه قواعد و دستورها به شکل زبان طبیعی.

هر روش مزایا و معایب خودش را دارد. دستورها شهودی و برای غیرمتخصصان آسان‌اند، اما می‌توانند در برابر رانش داده آسیب‌پذیر باشند. مثال‌ها بسیار دقیق‌اند و می‌توانند رفتارهای ظریف را بیان کنند، اما تولیدشان پرزحمت است. پس یک گردش‌کار چگونه می‌تواند باشد که هر دو روش را ترکیب کند و با استفاده از مدل‌های بزرگ عمومی و داده‌های مشخص، مدل‌های متمرکزِ مخصوصِ وظیفه توسعه دهد؟

کاربردهای عملی و یادگیری انتقالی

یک گردش‌کار عملی هوش مصنوعی شامل ارزیابی و اصلاح پیش‌بینی‌های مدل به‌صورت تکرارشونده است، با استفاده از یادگیری انتقالی برای تقطیر مدل‌های عمومی به مدل‌های مشخص. یادگیری انتقالی برای کاربردهای عملی همچنان مرتبط است و راهکارهایی ماژولار، قابل تفسیر، و مقرون‌به‌صرفه فراهم می‌کند.

استفاده از مدل‌های مولد بزرگ به حل مشکل شروع سرد کمک می‌کند و اجازه می‌دهد نمونه‌های اولیه از همان ابتدا کار کنند. این نمونه‌ها سپس می‌توانند پالایش و به مدل‌های کوچک‌تر، سریع‌تر، و مشخص‌تر تقطیر شوند. این رویکرد از فرایند پرزحمت تولید مثال‌ها از صفر پرهیز می‌کند و وابستگی به مدل‌های عظیم و پیچیده در زمان اجرا را کاهش می‌دهد.

تقطیرِ مدل‌های مخصوصِ وظیفه با انسان در حلقه

توسعه مدل‌های تقطیرشده مخصوصِ وظیفه با بهترین شیوه‌های نرم‌افزار هم‌راستا است و مزیت‌های فراوانی ارائه می‌دهد:

ماژولار: رویکرد بسیار ماژولار است و با بهترین شیوه‌های توسعه نرم‌افزار هم‌راستا است. این اجازه می‌دهد گردش‌کارهای مدرن حفظ شوند و توسعه مدل متناسب با آن‌ها سازگار شود.
بدون قفل‌شدن: کاربران به هیچ ارائه‌دهنده مشخصی بسته نمی‌شوند. مدل‌ها می‌توانند با ارائه‌دهنده‌های مختلف توسعه پیدا کنند، اما در زمان اجرا می‌توانند مستقل مالکیت و مدیریت شوند.
قابل آزمون: مؤلفه‌ها می‌توانند به‌صورت جداگانه آزموده شوند، و در مقایسه با یک سیستم تکِ جعبه‌سیاه، پایش و تشخیص شکست‌ها آسان‌تر می‌شود.
انعطاف‌پذیر و ارزان برای اجرا: مدل‌ها مؤلفه‌های انعطاف‌پذیر در یک سیستم هستند و می‌توانند بهینه شوند تا کارآمد اجرا شوند، حتی روی CPUها یا با ردپای کوچک، و هزینه‌های عملیاتی را به‌طور چشمگیر کاهش دهند.
قابل اجرا در داخل سازمان: برای مدیریت امن داده‌های حساس بدون تکیه بر APIهای بیرونی حیاتی است، و حریم خصوصی داده و انطباق مقرراتی را تضمین می‌کند.
شفاف و قابل پیش‌بینی: کاربران دیدپذیری نسبت به شیوه کار مدل‌ها دارند، که به فهم بهتر و پیش‌بینی‌پذیری رفتار مدل کمک می‌کند.
برنامه‌پذیر: مدل‌ها می‌توانند به‌صورت برنامه‌ای در گردش‌کارهای موجود یکپارچه شوند، با نیازهای کسب‌وکار هم‌راستا شوند، و چالش‌های یکپارچه‌سازی را کمینه کنند.

این‌ها همان دلیل‌هایی هستند که شرکت‌ها نرم‌افزار متن‌باز را انتخاب می‌کنند، که تصادفی نیست: توسعه هوش مصنوعی هنوز نوعی توسعه نرم‌افزار است و همان اصول اعمال می‌شود.

رسیدگی به نگرانی‌ها و مقررات‌گذاری

صرفه‌جویی‌های مقیاس، که زمانی برای سلطه انحصاری حیاتی فرض می‌شد، در فناوری با چالش روبه‌رو است، چون رقابت شدید هزینه‌ها را پایین می‌کشد. توانایی تکیه بر مدل‌های متن‌باز که در غیر این صورت گران‌اند در مرحله توسعه به‌جای مرحله تولید، این «خندق دفاعی» را حتی کم‌اهمیت‌تر می‌کند.

مقررات‌گذاری به‌عنوان راهبرد دیگری ظاهر می‌شود که شرکت‌های بزرگ فناوری برای حفظ انحصار در این حوزه دنبال می‌کنند، و در سراسر جهان دولت‌ها را لابی می‌کنند تا قوانین هوش مصنوعی تصویب شود که فقط خودشان بتوانند از عهده انطباق با آن برآیند.

حفظ شفافیت در مقررات‌گذاری برای اطمینان از این‌که هوش مصنوعی بدون کنترل انحصاری تکامل پیدا کند ضروری است. با مرزبندی میان کاربردها و فناوری‌های هسته‌ای، سیاست‌گذاران می‌توانند چشم‌اندازی رقابتی ایجاد کنند که نوآوری را تشویق کند و هم‌زمان از منافع مصرف‌کننده محافظت کند. این تمایز در هدایت هوش مصنوعی به سمت آینده‌ای از نوآوری و دسترسی‌پذیری حیاتی است، جایی که هیچ موجودیت واحدی نفوذ ناموجه در بازار نداشته باشد.

نتیجه‌گیری‌ها

چشم‌انداز توسعه و استقرار هوش مصنوعی بیشتر با شفافیت و دسترسی‌پذیری تعریف می‌شود تا مزیت‌های پنهان‌کارانه. در قلمرو مدل‌های زبانی بزرگ (LLMs)، که مؤلفه‌های یکپارچه هستند نه محصولات مستقل، هیچ مزیت ذاتی برای ساختن انحصار از دانش اختصاصی یا دسترسی انحصاری به داده وجود ندارد.

این مدل‌ها می‌توانند به‌طور مؤثر با روش‌های دیگر جایگزین شوند یا در کنار آن‌ها به کار گرفته شوند، و این، هم‌کنش‌پذیری و رقابت را تقویت می‌کند، یعنی درست خلاف انحصار. نرم‌افزار متن‌باز نقش مهمی در تضمین این انعطاف‌پذیری دارد و نوآوری را از طریق توسعه مشارکتی و موشکافی جامعه ترویج می‌کند.

با این حال، احتمال این‌که تدابیر مقرراتی ناخواسته به نفع رفتارهای انحصاری تمام شود همچنان یک نگرانی است. برای جلوگیری از این، مقررات باید روی تنظیم رفتارها و موارد استفاده تمرکز کند، نه هدف‌گرفتن فناوری‌های مشخص یا مؤلفه‌های نرم‌افزاری خاص.

این رویکرد متعادل برای حفظ یک محیط رقابتی و فراگیر در توسعه هوش مصنوعی ضروری است. همچنین از نفوذ ناموجه تلاش‌های لابی‌گری صنعتی که ممکن است بخواهند چارچوب‌های مقرراتی را برای منفعت خودشان منحرف کنند دوری می‌کند.

آیا انقلاب هوش مصنوعی انحصاری نخواهد شد؟

نکات کلیدی

نقطه مقابلِ متن‌باز

بُعد اقتصادیِ متن‌باز

برداشت اشتباه از مدل‌های زبانی بزرگ

نقش صرفه‌جویی‌های مقیاس

تمایز میان هوش مصنوعیِ رو‌به‌انسان و رو‌به‌ماشین

توانمندی‌های هوش مصنوعی در عمل

تکاملِ گفتن به کامپیوتر که چه کار کند

کاربردهای عملی و یادگیری انتقالی

تقطیرِ مدل‌های مخصوصِ وظیفه با انسان در حلقه

رسیدگی به نگرانی‌ها و مقررات‌گذاری

نتیجه‌گیری‌ها

دیدگاهتان را بنویسید لغو پاسخ

مشاهده کلیه مطالب

برنامه کاربردی وب (Web Application) چیست؟

رابط برنامه‌نویسی کاربردی (Application Programming Interface) چیست؟

مدل‌های خودرگرسیو (Autoregressive Models) چه هستند؟

سی‌آی‌اس بنچمارکس (CIS Benchmarks) چیست؟

پیوندهای کاربردی

نکات کلیدی

نقطه مقابلِ متن‌باز

بُعد اقتصادیِ متن‌باز

برداشت اشتباه از مدل‌های زبانی بزرگ

نقش صرفه‌جویی‌های مقیاس

تمایز میان هوش مصنوعیِ رو‌به‌انسان و رو‌به‌ماشین

توانمندی‌های هوش مصنوعی در عمل

تکاملِ گفتن به کامپیوتر که چه کار کند

کاربردهای عملی و یادگیری انتقالی

تقطیرِ مدل‌های مخصوصِ وظیفه با انسان در حلقه

رسیدگی به نگرانی‌ها و مقررات‌گذاری

نتیجه‌گیری‌ها

دیدگاهتان را بنویسید لغو پاسخ

مشاهده کلیه مطالب

برنامه کاربردی وب (Web Application) چیست؟

رابط برنامه‌نویسی کاربردی (Application Programming Interface) چیست؟

مدل‌های خودرگرسیو (Autoregressive Models) چه هستند؟

سی‌آی‌اس بنچمارکس (CIS Benchmarks) چیست؟

فرم تماس با ما