آیا انقلاب هوش مصنوعی APIها را کنار می‌گذارد؟

فقط در صورتی که توجه نکرده باشید، هوش مصنوعی همه‌جا حضور دارد. تلاش برای خواندن هر مجله آنلاین یا تماشای بازی Sunday Night Football بدون مواجهه با اشاره‌ای به هوش مصنوعی اکنون رسماً غیرممکن است. اگر به تبلیغات اخیر برای سازندگان وب‌سایت با هوش مصنوعی نگاه کنید، دیگر نیازی به نویسنده، طراح یا توسعه‌دهنده ندارید.

واقعیت، البته، ممکن است کاملاً متفاوت باشد. برای هر خبری درباره ادغام هوش مصنوعی در یک محصول، یک مقاله یوتیوبی دیگر درباره محدودیت‌های هوش مصنوعی مولد یا یک یادداشت تحلیلی درباره توقف پیشرفت آن وجود دارد. حقیقت احتمالاً جایی در وسط قرار دارد.

اخیراً، ما به‌طور گسترده درباره هوش مصنوعی مولد و APIها نوشته‌ایم، که به نظر می‌رسد همراهان طبیعی هستند. تحلیلگرانی مانند Paul Dumas آینده‌ای ترسیم می‌کنند که در آن هوش مصنوعی APIها را مصرف (و تولید) می‌کند و آن‌ها را برای بازیابی داده و گسترش مدل‌های خود فرا می‌خواند. اگر این چشم‌انداز به واقعیت تبدیل شود، تغییر مسیر برای پشتیبانی از این نوع مصرف API برای ارائه‌دهندگان API ضروری خواهد بود تا مرتبط باقی بمانند.

در Platform Summit 2024، Zdenek “Z” Nemec از Superface.ai شکاف بین پتانسیل و واقعیت را شناسایی کرد. طبق گفته Nemec، هنگام استفاده از عوامل هوش مصنوعی، در بسیاری از موارد، دسترسی به داده‌ها و انجام اقدامات از طریق UI آسان‌تر، سریع‌تر و ارزان‌تر از استفاده از APIها است. او می‌گوید: «اغلب، تنها راه انجام آن همین است.» در ادامه، ما به ادعای Nemec می‌پردازیم که APIهای مدرن یک گلوگاه برای عوامل خودکار هستند، توانایی نوآوری را محدود می‌کنند و اینکه چگونه (یا آیا اصلاً) می‌توان این مشکل را حل کرد.

محدودیت‌های عوامل مبتنی بر LLM

با وجود آنچه برخی افراد هنوز فکر می‌کنند، عوامل هوش مصنوعی همه‌چیزدان یا همه‌چیزبین نیستند (هنوز). همان‌طور که Nemec می‌گوید، «آن‌ها اساساً تکه‌های نرم‌افزاری هستند که به نمایندگی از یک کاربر یا برنامه دیگر عمل می‌کنند. آن‌ها می‌توانند تصمیم بگیرند و کارهای مفید دیگری انجام دهند، اما تنها به اندازه ابزارهایی که در اختیار دارند خوب هستند.» و بسیاری از عوامل هنوز ابزارهای مناسب را ندارند.

وقتی عوامل بتوانند معناشناسی را استنباط کنند، می‌توانند مانند انسان عمل کنند. به عبارت دیگر، آن‌ها می‌توانند از مستندات API (به ویژه از فرمت‌های استاندارد مانند OpenAPI Specification) برای فهمیدن اینکه کدام endpointها را باید فراخوانی کنند تا داده‌های مورد نیاز خود را دریافت کنند، استفاده کنند.

متأسفانه، هیچ تضمینی وجود ندارد که آن‌ها واقعاً بتوانند آن endpointها را فراخوانی کنند. Nemec مثال LinkedIn را ارائه می‌دهد، اگرچه سرویس API دارد، او می‌گوید «دسترسی به آن آسان نیست» و «کارکرد آن محدود است.» او پیشنهاد می‌کند که دسترسی موفق به API می‌تواند چند هفته طول بکشد، سپس آن را با سرویس اسکرپینگ شخص ثالث مقایسه می‌کند که می‌توان آن را در عرض یک دقیقه به یک عامل متصل کرد.

مثال‌های مشابهی برای Instagram و Salesforce وجود دارد، که در آن خدمات اسکرین‌اسکرپینگ شخص ثالث راحت‌تر و آسان‌تر از APIهای رسمی در دسترس هستند.

اتوماسیون ورودی انسانی از طریق عوامل هوش مصنوعی، به‌عنوان مثال برای بهره‌برداری از چنین خدماتی و بازیابی خودکار داده‌ها، به‌سرعت به جایگزینی جذاب برای APIها تبدیل می‌شود. «Operator» شرکت OpenAI، که در زمان نگارش مقاله قرار است به زودی عرضه شود، یکی از بسیاری از این ابزارها است.

و این یک برد برای کاربران نهایی است، زیرا به گفته Nemec، «LLMها هنگام انجام وظایف پیچیده با APIهای پیچیده عملکرد ضعیفی دارند.» APIها معمولاً شامل بسیاری از متدها، شناسه‌های شی، فیلدها و انواع داده هستند و این جزئیات زیاد سطح انتزاعی بالایی ایجاد می‌کند که ابزارهای هوش مصنوعی با آن مشکل دارند.

محدودیت‌های APIها (برای عوامل هوش مصنوعی)

همان‌طور که وجود دارد، چندین عامل میزان توانایی ابزارهای هوش مصنوعی مانند چت‌بات‌ها برای تعامل مؤثر با APIها را محدود می‌کند. Nemec موارد زیر را برجسته می‌کند:

دسترسی محدود یا عدم دسترسی به APIها برای توسعه‌دهندگان (و بنابراین عوامل)
APIهای قدیمی (WS/RPC) و/یا نبود مستندات به‌روز
APIها تنها بخشی از آنچه با UI قابل انجام است را پوشش می‌دهند
APIهای بیش‌پیچیده یا حجیم که فراخوانی آن‌ها دشوار است

تا همین اواخر، و حتی اکنون، تمایل به گسترش دامنه APIها برای آسان‌تر کردن زندگی توسعه‌دهندگان هنگام استفاده از ابزارهای هوش مصنوعی محدود بوده است. و دلیل آن مشخص است.

مصرف API امکان انتخاب بخش‌هایی از عملکردها را فراهم می‌کند، که می‌تواند به کاربران کمک کند از وابستگی به یک فروشنده جلوگیری کنند. عوامل هوش مصنوعی، به گفته Nemec، «چسبندگی محصولات امروز را به چالش می‌کشند زیرا اساساً رابط متفاوتی برای آن برنامه‌های ابری و SaaS هستند.»

او پیشنهاد می‌کند این موضوع با تغییر APIها از پروژه‌های جانبی سرگرم‌کننده به ارائه‌های تجاری واقعی مرتبط است، که همان چیزی است که ما آن را اقتصاد API می‌نامیم. نتیجه این است که اگر شرکت‌ها از تغییر موارد فوق نتیجه مالی نبیند، انگیزه‌ای برای انجام آن ندارند.

آیا اقتصاد API با هوش مصنوعی سازگار خواهد شد؟

Nemec در توضیح برخی از محرک‌های کلیدی کسب‌وکار در اقتصاد API — مانند درآمد مستقیم، چسبندگی، ارزش افزوده و ایجاد روابط با شرکا — اذعان می‌کند که نوآوری و کارایی، که آن‌ها را «فرهنگ remix» می‌نامد، مهم هستند. با این حال، به تنهایی، ممکن است به اندازه کافی مهم تلقی نشوند تا تغییر را تحریک کنند. اما آن‌ها تنها نیستند.

Nemec می‌گوید: «عوامل B2B در راه هستند. آن‌ها انبارها، موجودی کالا، تولیدکنندگان و غیره را بررسی خواهند کرد.» به عبارت دیگر، هوش مصنوعی تنها از طریق جمع‌آوری داده‌ها و بهبود ارائه ارزش افزوده نمی‌کند — بلکه دارای قابلیت‌های خرید واقعی است که تأثیر مالی مستقیم دارد.

اما جایی که مشکل دارد، عامل چسبندگی است. Nemec بیان می‌کند: «شرکت‌ها می‌خواهند ما جلوی صفحه نمایش باقی بمانیم و از UI آن‌ها استفاده کنیم.» (اگرچه در حال حاضر درست است، اما اهمیت APIهای استاندارد در backend برای حفظ اقتصاد در صورتی که UIها کم‌رنگ شوند، را نشان می‌دهد.)

این توضیح می‌دهد، دست‌کم تا حدی، چرا بسیاری از شرکت‌ها عجله دارند تا قابلیت‌های هوش مصنوعی با برچسب سفید را در محصولات خود تعبیه کنند. آن‌ها می‌خواهند ما در تجربه برند خود باقی بمانیم و به ابزارهای شخص ثالث مانند ChatGPT یا Gemini نرویم.

آیا هوش مصنوعی با APIها سازگار خواهد شد؟

با وجود موارد فوق، بی‌انصافی است که این مشکل را یک‌طرفه تصور کنیم. باز کردن APIها برای ابزارهایی مانند عوامل هوش مصنوعی مجموعه‌ای از مسائل حاکمیتی را ایجاد می‌کند. وقتی کاربران از خدمات شخص ثالث برای اسکرپ داده استفاده می‌کنند، ارائه‌دهندگان می‌توانند انکار منطقی داشته باشند — می‌توانند بگویند: «خب، ما هرگز قصد نداشتیم مردم از آن به این شکل استفاده کنند.»

به محض اینکه داده‌ها را به‌صورت رسمی ارائه دهند، داستان کاملاً متفاوت می‌شود. این موضوع مسئولیت را بر دوش ارائه‌دهندگان API قرار می‌دهد تا اطمینان حاصل کنند که تعهدات رعایت قوانین خود را انجام می‌دهند… زیرا LLMها و ابزارهای هوش مصنوعی بدون تردید داده‌های حساس را به‌طور نامناسب منتشر خواهند کرد.

با این حال، Nemec معتقد است که عوامل آینده مصرف API هستند. در همین حال، او پیشنهاد می‌کند که مدل‌های عمل بزرگ (LAMها) می‌توانند به عنوان پل به آن آینده عمل کنند. LAMها از وب و اسکرین اکترها استفاده می‌کنند، مشابه اتوماسیون فرآیند رباتیک، تا به نمایندگی از شما با سیستم‌ها تعامل داشته باشند.

پس، آیا LAMها جایگزین APIها خواهند شد؟ احتمالاً نه. (خبر خوب برای ما، زیرا «Nordic LAMs» همان جذابیت را ندارد.) Nemec، مشابه Bill Doerffeld ما، پیشنهاد می‌کند که ما به APIها بیش از همیشه نیاز داریم. با این حال، ما باید «نیروی هدایت‌شده بیشتری اعمال کنیم» و «فکر کنیم چگونه و برای چه کسی در حال ساخت هستیم.»

همچنین باید اطمینان حاصل کنیم که APIهایی که ارائه می‌کنیم واقعاً به‌طور مؤثر کار می‌کنند — هیچ مستندات ناقص یا endpoint یا فیلدهای مفقود وجود نداشته باشد! — تا از مشکل دور زدن APIها توسط توسعه‌دهندگان با استفاده از RAG و نرم‌افزار اسکرین‌اسکرپینگ جلوگیری شود.

Nemec فرض می‌کند که ممکن است به تقسیم ۸۰:۲۰ بین هوش مصنوعی و انسان برسیم. همان‌طور که مصرف API از انسان‌ها به سمت عوامل خودکار منتقل می‌شود، باید راه‌هایی برای پشتیبانی از این نوع مصرف از طریق دسترسی ساده و مستندات قابل خواندن توسط ماشین پیدا کنیم.

وگرنه خطر از دست دادن یک جمعیت عظیم وجود دارد. درود بر اربابان ربات‌ها!

آیا انقلاب هوش مصنوعی APIها را کنار می‌گذارد؟

محدودیت‌های عوامل مبتنی بر LLM

محدودیت‌های APIها (برای عوامل هوش مصنوعی)

آیا اقتصاد API با هوش مصنوعی سازگار خواهد شد؟

آیا هوش مصنوعی با APIها سازگار خواهد شد؟

دیدگاهتان را بنویسید لغو پاسخ

مشاهده کلیه مطالب

زمان رفت و برگشت (Round-Trip Time) در شبکه چیست؟

نرم‌افزار به عنوان سرویس (SaaS) چیست؟

وضعیت بانکداری دیجیتال در بریتانیا چگونه است؟

امنیت نقطه پایانی (Endpoint Security) چیست؟

وب سرویس ها

محصولات

پیوندهای کاربردی

پیوندهای کاربردی

محدودیت‌های عوامل مبتنی بر LLM

محدودیت‌های APIها (برای عوامل هوش مصنوعی)

آیا اقتصاد API با هوش مصنوعی سازگار خواهد شد؟

آیا هوش مصنوعی با APIها سازگار خواهد شد؟

دیدگاهتان را بنویسید لغو پاسخ

مشاهده کلیه مطالب

زمان رفت و برگشت (Round-Trip Time) در شبکه چیست؟

نرم‌افزار به عنوان سرویس (SaaS) چیست؟

وضعیت بانکداری دیجیتال در بریتانیا چگونه است؟

امنیت نقطه پایانی (Endpoint Security) چیست؟

فرم تماس با ما