فقط در صورتی که توجه نکرده باشید، هوش مصنوعی همهجا حضور دارد. تلاش برای خواندن هر مجله آنلاین یا تماشای بازی Sunday Night Football بدون مواجهه با اشارهای به هوش مصنوعی اکنون رسماً غیرممکن است. اگر به تبلیغات اخیر برای سازندگان وبسایت با هوش مصنوعی نگاه کنید، دیگر نیازی به نویسنده، طراح یا توسعهدهنده ندارید.
واقعیت، البته، ممکن است کاملاً متفاوت باشد. برای هر خبری درباره ادغام هوش مصنوعی در یک محصول، یک مقاله یوتیوبی دیگر درباره محدودیتهای هوش مصنوعی مولد یا یک یادداشت تحلیلی درباره توقف پیشرفت آن وجود دارد. حقیقت احتمالاً جایی در وسط قرار دارد.
اخیراً، ما بهطور گسترده درباره هوش مصنوعی مولد و APIها نوشتهایم، که به نظر میرسد همراهان طبیعی هستند. تحلیلگرانی مانند Paul Dumas آیندهای ترسیم میکنند که در آن هوش مصنوعی APIها را مصرف (و تولید) میکند و آنها را برای بازیابی داده و گسترش مدلهای خود فرا میخواند. اگر این چشمانداز به واقعیت تبدیل شود، تغییر مسیر برای پشتیبانی از این نوع مصرف API برای ارائهدهندگان API ضروری خواهد بود تا مرتبط باقی بمانند.
در Platform Summit 2024، Zdenek “Z” Nemec از Superface.ai شکاف بین پتانسیل و واقعیت را شناسایی کرد. طبق گفته Nemec، هنگام استفاده از عوامل هوش مصنوعی، در بسیاری از موارد، دسترسی به دادهها و انجام اقدامات از طریق UI آسانتر، سریعتر و ارزانتر از استفاده از APIها است. او میگوید: «اغلب، تنها راه انجام آن همین است.» در ادامه، ما به ادعای Nemec میپردازیم که APIهای مدرن یک گلوگاه برای عوامل خودکار هستند، توانایی نوآوری را محدود میکنند و اینکه چگونه (یا آیا اصلاً) میتوان این مشکل را حل کرد.
محدودیتهای عوامل مبتنی بر LLM
با وجود آنچه برخی افراد هنوز فکر میکنند، عوامل هوش مصنوعی همهچیزدان یا همهچیزبین نیستند (هنوز). همانطور که Nemec میگوید، «آنها اساساً تکههای نرمافزاری هستند که به نمایندگی از یک کاربر یا برنامه دیگر عمل میکنند. آنها میتوانند تصمیم بگیرند و کارهای مفید دیگری انجام دهند، اما تنها به اندازه ابزارهایی که در اختیار دارند خوب هستند.» و بسیاری از عوامل هنوز ابزارهای مناسب را ندارند.
وقتی عوامل بتوانند معناشناسی را استنباط کنند، میتوانند مانند انسان عمل کنند. به عبارت دیگر، آنها میتوانند از مستندات API (به ویژه از فرمتهای استاندارد مانند OpenAPI Specification) برای فهمیدن اینکه کدام endpointها را باید فراخوانی کنند تا دادههای مورد نیاز خود را دریافت کنند، استفاده کنند.
متأسفانه، هیچ تضمینی وجود ندارد که آنها واقعاً بتوانند آن endpointها را فراخوانی کنند. Nemec مثال LinkedIn را ارائه میدهد، اگرچه سرویس API دارد، او میگوید «دسترسی به آن آسان نیست» و «کارکرد آن محدود است.» او پیشنهاد میکند که دسترسی موفق به API میتواند چند هفته طول بکشد، سپس آن را با سرویس اسکرپینگ شخص ثالث مقایسه میکند که میتوان آن را در عرض یک دقیقه به یک عامل متصل کرد.
مثالهای مشابهی برای Instagram و Salesforce وجود دارد، که در آن خدمات اسکریناسکرپینگ شخص ثالث راحتتر و آسانتر از APIهای رسمی در دسترس هستند.
اتوماسیون ورودی انسانی از طریق عوامل هوش مصنوعی، بهعنوان مثال برای بهرهبرداری از چنین خدماتی و بازیابی خودکار دادهها، بهسرعت به جایگزینی جذاب برای APIها تبدیل میشود. «Operator» شرکت OpenAI، که در زمان نگارش مقاله قرار است به زودی عرضه شود، یکی از بسیاری از این ابزارها است.
و این یک برد برای کاربران نهایی است، زیرا به گفته Nemec، «LLMها هنگام انجام وظایف پیچیده با APIهای پیچیده عملکرد ضعیفی دارند.» APIها معمولاً شامل بسیاری از متدها، شناسههای شی، فیلدها و انواع داده هستند و این جزئیات زیاد سطح انتزاعی بالایی ایجاد میکند که ابزارهای هوش مصنوعی با آن مشکل دارند.
محدودیتهای APIها (برای عوامل هوش مصنوعی)
همانطور که وجود دارد، چندین عامل میزان توانایی ابزارهای هوش مصنوعی مانند چتباتها برای تعامل مؤثر با APIها را محدود میکند. Nemec موارد زیر را برجسته میکند:
-
دسترسی محدود یا عدم دسترسی به APIها برای توسعهدهندگان (و بنابراین عوامل)
-
APIهای قدیمی (WS/RPC) و/یا نبود مستندات بهروز
-
APIها تنها بخشی از آنچه با UI قابل انجام است را پوشش میدهند
-
APIهای بیشپیچیده یا حجیم که فراخوانی آنها دشوار است
تا همین اواخر، و حتی اکنون، تمایل به گسترش دامنه APIها برای آسانتر کردن زندگی توسعهدهندگان هنگام استفاده از ابزارهای هوش مصنوعی محدود بوده است. و دلیل آن مشخص است.
مصرف API امکان انتخاب بخشهایی از عملکردها را فراهم میکند، که میتواند به کاربران کمک کند از وابستگی به یک فروشنده جلوگیری کنند. عوامل هوش مصنوعی، به گفته Nemec، «چسبندگی محصولات امروز را به چالش میکشند زیرا اساساً رابط متفاوتی برای آن برنامههای ابری و SaaS هستند.»
او پیشنهاد میکند این موضوع با تغییر APIها از پروژههای جانبی سرگرمکننده به ارائههای تجاری واقعی مرتبط است، که همان چیزی است که ما آن را اقتصاد API مینامیم. نتیجه این است که اگر شرکتها از تغییر موارد فوق نتیجه مالی نبیند، انگیزهای برای انجام آن ندارند.
آیا اقتصاد API با هوش مصنوعی سازگار خواهد شد؟
Nemec در توضیح برخی از محرکهای کلیدی کسبوکار در اقتصاد API — مانند درآمد مستقیم، چسبندگی، ارزش افزوده و ایجاد روابط با شرکا — اذعان میکند که نوآوری و کارایی، که آنها را «فرهنگ remix» مینامد، مهم هستند. با این حال، به تنهایی، ممکن است به اندازه کافی مهم تلقی نشوند تا تغییر را تحریک کنند. اما آنها تنها نیستند.
Nemec میگوید: «عوامل B2B در راه هستند. آنها انبارها، موجودی کالا، تولیدکنندگان و غیره را بررسی خواهند کرد.» به عبارت دیگر، هوش مصنوعی تنها از طریق جمعآوری دادهها و بهبود ارائه ارزش افزوده نمیکند — بلکه دارای قابلیتهای خرید واقعی است که تأثیر مالی مستقیم دارد.
اما جایی که مشکل دارد، عامل چسبندگی است. Nemec بیان میکند: «شرکتها میخواهند ما جلوی صفحه نمایش باقی بمانیم و از UI آنها استفاده کنیم.» (اگرچه در حال حاضر درست است، اما اهمیت APIهای استاندارد در backend برای حفظ اقتصاد در صورتی که UIها کمرنگ شوند، را نشان میدهد.)
این توضیح میدهد، دستکم تا حدی، چرا بسیاری از شرکتها عجله دارند تا قابلیتهای هوش مصنوعی با برچسب سفید را در محصولات خود تعبیه کنند. آنها میخواهند ما در تجربه برند خود باقی بمانیم و به ابزارهای شخص ثالث مانند ChatGPT یا Gemini نرویم.
آیا هوش مصنوعی با APIها سازگار خواهد شد؟
با وجود موارد فوق، بیانصافی است که این مشکل را یکطرفه تصور کنیم. باز کردن APIها برای ابزارهایی مانند عوامل هوش مصنوعی مجموعهای از مسائل حاکمیتی را ایجاد میکند. وقتی کاربران از خدمات شخص ثالث برای اسکرپ داده استفاده میکنند، ارائهدهندگان میتوانند انکار منطقی داشته باشند — میتوانند بگویند: «خب، ما هرگز قصد نداشتیم مردم از آن به این شکل استفاده کنند.»
به محض اینکه دادهها را بهصورت رسمی ارائه دهند، داستان کاملاً متفاوت میشود. این موضوع مسئولیت را بر دوش ارائهدهندگان API قرار میدهد تا اطمینان حاصل کنند که تعهدات رعایت قوانین خود را انجام میدهند… زیرا LLMها و ابزارهای هوش مصنوعی بدون تردید دادههای حساس را بهطور نامناسب منتشر خواهند کرد.
با این حال، Nemec معتقد است که عوامل آینده مصرف API هستند. در همین حال، او پیشنهاد میکند که مدلهای عمل بزرگ (LAMها) میتوانند به عنوان پل به آن آینده عمل کنند. LAMها از وب و اسکرین اکترها استفاده میکنند، مشابه اتوماسیون فرآیند رباتیک، تا به نمایندگی از شما با سیستمها تعامل داشته باشند.
پس، آیا LAMها جایگزین APIها خواهند شد؟ احتمالاً نه. (خبر خوب برای ما، زیرا «Nordic LAMs» همان جذابیت را ندارد.) Nemec، مشابه Bill Doerffeld ما، پیشنهاد میکند که ما به APIها بیش از همیشه نیاز داریم. با این حال، ما باید «نیروی هدایتشده بیشتری اعمال کنیم» و «فکر کنیم چگونه و برای چه کسی در حال ساخت هستیم.»
همچنین باید اطمینان حاصل کنیم که APIهایی که ارائه میکنیم واقعاً بهطور مؤثر کار میکنند — هیچ مستندات ناقص یا endpoint یا فیلدهای مفقود وجود نداشته باشد! — تا از مشکل دور زدن APIها توسط توسعهدهندگان با استفاده از RAG و نرمافزار اسکریناسکرپینگ جلوگیری شود.
Nemec فرض میکند که ممکن است به تقسیم ۸۰:۲۰ بین هوش مصنوعی و انسان برسیم. همانطور که مصرف API از انسانها به سمت عوامل خودکار منتقل میشود، باید راههایی برای پشتیبانی از این نوع مصرف از طریق دسترسی ساده و مستندات قابل خواندن توسط ماشین پیدا کنیم.
وگرنه خطر از دست دادن یک جمعیت عظیم وجود دارد. درود بر اربابان رباتها!
