اهمیت مدلهای زبانی کوچک در پیشبرد فناوری هوش مصنوعی؛
پیش به سوی مدلهای زبانی کوچکتر

به گزارش گروه آنلاین روزنامه دنیای اقتصاد؛ بحثهای امروز فعالان حوزه فناوری درباره پیشرفتهای نهچندان چشمگیر مدلهای زبانی بزرگ (LLMs)، مشابه صحبت در مورد کندی نوآوری گوشیهای هوشمند شده است. موج شگفتی ابتدایی چتجیپیتی شرکت اوپنایآی به اندازه معرفی آیفون اپل در سال ۲۰۰۷ انقلابی بود. اکنون اما معرفی نوآوری جدید در هوش مصنوعی، بیشتر شبیه بهروزرسانی گوشیهای هوشمند گاهی کاملا معمولی، به نظر میرسد.
کاهش سرعت پیشرفت در هوش مصنوعی نشانهای است از اینکه مدلهای زبانی بزرگ به انتظارات ایجادشده پاسخ ندادهاند. اکونومیست مینویسد شاید خبر مهمتر، ظهور جایگزینهای کوچکتر و چابکتر مدلهای زبانی است که مورد توجه کسبوکارها قرار گرفتهاند. بسیاری از شرکتها مدلهای سفارشی را ترجیح میدهند که بتوانند آنها را با نیازهای خاص خود هماهنگ کنند. این مدلهای زبانی کوچک (SLMs) در مقایسه با مدلهای زبانی بزرگ همهمنظوره ارزانتر هستند و باعث شده همهکاره بودن مدلهای زبانی بزرگ گاهی غیرضروری به نظر برسد. همانطور که دیوید کاکس، رئیس تحقیقات مدلهای هوش مصنوعی در شرکت فناوری آیبیام، میگوید: «ربات گفتوگوی منابع انسانی شما نیازی به دانستن فیزیک پیشرفته ندارد.»
علاوه بر این، مدلهای زبانی کوچک بهراحتی روی سیستمهای فناوری اطلاعات داخلی شرکتها یا تنها با کمک سرویس ابری اجرا میشوند. اندازه کوچکتر این مدلها آنها را بهویژه برای استفاده در گوشیهای هوشمند، خودروهای خودران و رباتها سازگار کرده است. اگر پیشرفت فعلی مدلهای زبانی کوچک ادامه داشته باشد، میتواند مهر تاییدی بر تصمیم شرکتهایی مانند اپل برای عدم سرمایهگذاری کلان در مدلهای زبانی بزرگ باشد.
دلیل دیگر محبوبیت رو به رشد مدلهای زبانی کوچک، بعد اقتصادی آن است. شرکتها از سرمایهگذاریهای هنگفت روزهای اولیه معرفی هوش مصنوعی مولد فاصله گرفته و بر بازگشت سرمایه متمرکز شدهاند. اکونومیست مینویسد اگرچه هنوز مدلهای زبانی بزرگ میتوانند مزیت خود را داشته باشند، اما استفاده از مدلهای زبانی کوچک برای انجام کارهای مشخص و تکراری میتواند هزینهها را کاهش دهد.
در حال حاضر کماکان بازار بر مدلهای زبانی بزرگ متمرکز است. با وجود این که غولهای ابری مانند مایکروسافت و گوگل مدلهای بسیار کوچکی ساختهاند، باور به تداوم وضعیت موجود، هزینههای هنگفت لازم جهت آموزش و میزبانی مدلهای زبانی بزرگ را توجیهپذیر کرده است. البته رویکرد غولهای فناوری شاید زیاد دوام نداشته باشد. با توجه به مزایای نسبی مدلهای زبانی کوچک، رویکرد محتاطانه اپل ممکن است در درازمدت موجه به نظر برسد.//