پتانسیل هوش مصنوعی متنباز (The Potential of Open-Source AI)
هوش مصنوعی یکی از بحثبرانگیزترین و چالشبرانگیزترین موضوعات حال حاضر دنیای تکنولوژی است. طرفداران تکنولوژی، تواناییهای چشمگیر ابزارهای هوش مصنوعی مانند مدلهای زبانی بزرگ (LLMها) را برای افزایش بهرهوری و دموکراتیکسازی مهارتهایی که پیشتر فقط در اختیار متخصصان آموزشدیده بود، تحسین میکنند. بدبینان بیشتر روی خطرات هوش مصنوعی برای نیروی کار جهانی و تشدید نابرابری درآمد متمرکز هستند. علاوه بر این، هوش مصنوعی خصوصیشده این خطر را دارد که سوگیریها و رفتارهای موجود در دادههای آموزشی مدل را بازتولید کند. هوش مصنوعی متنباز ظرفیت کاهش بسیاری از این خطرات را دارد.
هوش مصنوعی متنباز اکنون بیش از هر زمان دیگری مورد توجه قرار گرفته است، بخشی به دلیل همین نگرانیها. مارک زاکربرگ هوش مصنوعی متنباز را «مسیر پیش رو» نامیده است. دیگران نیز به وضوح گوش کردهاند — از جمله IBM و گوگل که مدلهای هوش مصنوعی متنباز خود را منتشر کردهاند.
وقتی برخی از بزرگترین شرکتهای فناوری جهان زمان، پول و منابع قابلتوجهی را صرف هوش مصنوعی متنباز میکنند، قطعاً چیزی در آن وجود دارد. پس پتانسیلهای هوش مصنوعی متنباز چیست؟ برای درک درست مزایای مدلهای متنباز، ابتدا باید بفهمیم متنباز بودن یعنی چه.
Open-Source چیست؟
اصطلاح متنباز در ابتدا به یک فلسفۀ توسعه نرمافزار اشاره داشت؛ جایی که کد به صورت عمومی منتشر میشود تا هر کسی بتواند در آن مشارکت کند، آن را کپی کند یا تغییر دهد. از آن زمان، توسعه متنباز فراتر رفته و به رویکردهایی تبدیل شده که غیرمتمرکز و کاملاً مشارکتی هستند.
سازمانهای زیادی این فلسفه را در اصول بنیادین خود جای دادهاند. طبق تعریف Red Hat، برای آنکه یک ابزار، پروژه یا محصول متنباز محسوب شود، باید:
-
مشارکت همکارانه
-
مسئولیت مشترک
-
تبادل آزاد
-
شایستهسالار و فراگیر
-
توسعه مبتنی بر جامعه
-
همکاری آزاد
-
خودسازماندهی
-
احترام و عمل متقابل
را در بر داشته باشد.
این رویکرد متنباز باعث شکلگیری برخی از محبوبترین نرمافزارهای جهان مانند لینوکس و کوبرنتیز شده است. اما متنباز چه پتانسیلی برای هوش مصنوعی دارد؟
چگونه Open-Source میتواند به هوش مصنوعی کمک کند؟
یکی از بزرگترین انتقاداتی که به هوش مصنوعی وارد شده، چیزی است که پژوهشگران آن را «مشکل جعبه سیاه» مینامند. براساس گفتهٔ پروفسور سمیر رواشده از دانشگاه میشیگان–دربورن، این مشکل عیبیابی ابزارهای هوش مصنوعی را دشوار میکند، زیرا هیچکس دقیقاً نمیداند این ابزارها چگونه تصمیمگیری میکنند. برای اینکه هوش مصنوعی واقعاً ایمن و قابلاعتماد باشد، توسعهدهندگان باید آگاهی بیشتری از نحوۀ تصمیمگیری ابزارهایی مانند LLMها داشته باشند.
هوش مصنوعی متنباز فقط به معنای ابزارهای موجود در GitHub نیست؛ بلکه شامل دادههایی نیز میشود که LLM با آنها آموزش داده شده است. برای مثال، گفته میشود GPT-4 با ۱۰ تریلیون کلمه آموزش دیده، اما فقط توسعهدهندگان میدانند این کلمات چه بودهاند. البته، نیاز به شفافیت بیشتر به معنی افشای دادههای حساس نیست.
نسخه ۱.۰ «تعریف هوش مصنوعی متنباز» میگوید یک مدل برای اینکه متنباز به شمار آید، لازم نیست دادههای خام را منتشر کند؛ فقط باید «اطلاعات کافی در مورد دادههای آموزشی ارائه دهد تا یک فرد متخصص بتواند یک سیستم تقریباً معادل را بازتولید کند». بنابراین هوش مصنوعی متنباز ظرفیت بسیار بالایی دارد — فقط باید به شکل صحیح اجرا شود.
در ادامه چند مزیت دیگر هوش مصنوعی متنباز را بررسی میکنیم.
نوآوری بیشتر
همانطور که در مثالهای لینوکس و کوبرنتیز دیدیم، متنباز کردن یک ابزار یا پروژه میتواند سرعت توسعه را بسیار افزایش دهد. شروع نکردن هر پروژه از صفر مقدار چشمگیری زمان، انرژی و هزینه را کاهش میدهد. همچنین رفع اشکال بین جامعهای بزرگ توزیع میشود؛ ذهنهای بیشتر به معنای حل مشکلات سریعتر و آسانتر است.
دسترسی بهتر
ابزارهای هوش مصنوعی متنباز میتوانند مزایای هوش مصنوعی را در اختیار افراد بیشتری قرار دهند. وقتی کد، ابزارها و دادههای آموزشی برای همگان قابل دسترسی باشد — و نه فقط شرکتهای عظیم — موانع استفاده از پژوهشهای پیشرفته بهطور چشمگیری کاهش مییابد.
بهعنوان مثال، میتوان به پروژه InstructLab اشاره کرد؛ یک پروژه متنباز و مدلمحور برای کمک به مشارکت افراد بیشتر در آموزش LLMها.
ایمنی بیشتر
همانطور که گفته شد، LLMها فقط به اندازه دادههای آموزشی خود خوب هستند. نسخههای اولیه ChatGPT نمونههایی ترسناک از گفتار نفرتآمیز تولید میکردند، که با توجه به ماهیت جعبه سیاه، چندان عجیب نبود — احتمالاً دادههای شبکههای اجتماعی در آموزش مدل نقش داشتند.
متنباز بودن لزوماً این مشکلات را حل نمیکند، اما حداقل روشن میکند که مدل بر اساس چه دادههایی آموزش دیده است. این شفافیت امکان کاهش ریسکها و سوگیریها را فراهم میکند و همچنین به توسعهدهندگان اجازه میدهد ابزارها و محیطهای نظارتی مؤثرتری بسازند.
تشویق به رقابت
انحصارها برای نوآوری مضر هستند. شرکتهای انحصاری معمولاً انگیزهای برای تغییر وضعیت موجود ندارند. متنباز کردن هوش مصنوعی فضای رقابت را گسترش میدهد و به ابزارهایی مانند مدلهای زبانی کوچک (SLMها) اجازه رشد میدهد — مدلهایی که برای کاربردهای خاص آموزش دیدهاند.
SLMها در بسیاری از موارد عملکردی برابر یا حتی بهتر از LLMهای عظیم دارند، و بسیار سریعتر آموزش داده و منتشر میشوند. از سوی دیگر، باعث کاهش وابستگی کاربران و توسعهدهندگان به فروشندگان خاص میشود و خطر vendor lock-in را کم میکند.
کاهش هزینهها
در نهایت، هوش مصنوعی متنباز میتواند هزینه استفاده از هوش مصنوعی را کاهش دهد. متوسط حقوق یک دانشمند داده در آمریکا بیش از ۱۲۶ هزار دلار در سال است، بنابراین تنها شرکتهای بزرگ توان مالی برای توسعه مدلهای خصوصی را دارند — چه برسد به هزینه ذخیرهسازی و پردازش دادههای آموزشی.
معایب هوش مصنوعی متنباز
با وجود مزایای بسیار، این موضوع به این معنا نیست که هوش مصنوعی متنباز بدون ضعف است. هر فناوری نقاط قوت و ضعف خود را دارد و این کاربران هستند که باید تصمیم بگیرند آیا مزایا بر معایب میچربد یا خیر.
یکی از مشکلات احتمالی این است که برخی مدلهای بهظاهر متنباز در واقع کاملاً متنباز نیستند. مقالهای با عنوان The Model Openness Framework درباره پدیدهای به نام «شستوشوی متنباز» هشدار میدهد؛ حالتی که در آن بخشی از اجزا متنباز منتشر میشوند اما دیگر بخشها همچنان اختصاصی باقی میمانند. حتی ممکن است از ابزارهایی با برچسب متنباز استفاده شود که محدودیتهایی مثل استفاده غیرتجاری یا عدم رقابت دارند. بنابراین هنگام انتخاب ابزار متنباز، باید شرایط را با دقت بررسی کرد.
ارزیابی دقیق هوش مصنوعی متنباز در این مرحله کار آسانی نیست. «تعریف هوش مصنوعی متنباز» از سوی OSI قدمی مهم است، اما هنوز بهطور گسترده پذیرفته نشده است. نبود اجماع میتواند منجر به شکلگیری استانداردهای جدید شود و شرکتهایی که زود وارد این عرصه شدهاند مجبور شوند بخشی از کار خود را دوباره انجام دهند.
متنباز همیشه به معنی کاملاً باز نیست. برخی مدلها ممکن است تمام دادههای آموزشی و لاگهای خود را منتشر کنند، در حالی که برخی دیگر فقط دادههای آموزشی را آشکار میکنند اما نحوه استفاده از آن را توضیح نمیدهند — و این موضوع تشخیص رفتار مدل را دشوار میکند.
ابزارهای متنباز معمولاً به کار بیشتری نسبت به ابزارهای آماده نیاز دارند. حتی محبوبترین و بهترین پروژههای متنباز نیز نیازمند تنظیمات دقیق یا رفع اشکال هستند. بنابراین اگر تجربه کافی در حوزه تکنولوژی یا برنامهنویسی نداشته باشید، شاید هوش مصنوعی متنباز انتخاب مناسبی برای شما نباشد.
در نهایت، هوش مصنوعی متنباز ممکن است خطرات امنیتی ایجاد کند. نرمافزارهای متنباز به دلایل مختلف میتوانند در برابر حملات آسیبپذیر باشند. استفاده از این ابزارها ممکن است زنجیره تأمین شما را در معرض خطر قرار دهد — موضوعی که با توجه به پیشبینی افزایش حملات زنجیره تأمین در سال ۲۰۲۵ باید جدی گرفته شود.
آسیبپذیری در بستههای متنباز همیشه آشکار نیست. وابستگیهای پنهان یا کامیتهای مخرب ممکن است یک ابزار متنباز را آلوده کند، حتی اگر ظاهر کد مشکلی نداشته باشد. بنابراین، همانطور که در مورد مجوزها و حقوق استفاده دقت میکنید، لازم است برای ارزیابی امنیت ابزارهای متنباز نیز وقت کافی بگذارید.
جمعبندی: نگاه نهایی به هوش مصنوعی متنباز
با وجود تمام چالشها، هوش مصنوعی از بین نمیرود — بلکه به سرعت در حال گسترش است. طبق گزارش مککنزی، استفاده از هوش مصنوعی متنباز نیز در حال افزایش است: بیش از ۵۰ درصد از سازمانها از نوعی هوش مصنوعی متنباز استفاده میکنند. بیش از ۸۰ درصد از توسعهدهندگان هم گفتهاند تجربه کار با ابزارهای متنباز برای شغلشان ضروری است.
بنابراین سازمانهایی که قصد دارند از هوش مصنوعی استفاده کنند ناگزیر باید با هوش مصنوعی متنباز مواجه شوند — و یاد بگیرند چگونه بهطور مؤثر از آن استفاده کنند.
برای بهرهبرداری کامل از ظرفیتهای هوش مصنوعی متنباز، باید با «تعریف هوش مصنوعی متنباز» آشنا شوید. همانطور که OSI در مقاله Data Governance in Open Source AI اشاره میکند:
«سازمانهایی که به هوش مصنوعی باز، عادلانه و مبتنی بر منافع عمومی اهمیت میدهند، باید توجه ویژهای به اشتراکگذاری داده و حکمرانی داده داشته باشند.»
برای آنکه هوش مصنوعی واقعاً پتانسیل تحولآفرین خود را محقق کند، باید همگانی، در دسترس و شفاف باشد — بهویژه در مورد دادههای آموزشی و نحوه استفاده از آنها. هوش مصنوعی متنباز قدمی حیاتی در این مسیر است.
