پیش به سوی مدل‌های زبانی کوچک‌تر

دنیای اقتصاد: بحث‌های امروز فعالان حوزه فناوری درباره پیشرفت‌های نه‌چندان چشمگیر مدل‌های زبانی بزرگ (LLMs)، مشابه صحبت در مورد کندی نوآوری گوشی‌های هوشمند شده است. موج شگفتی ابتدایی چت‌جی‌پی‌تی شرکت اوپن‌ای‌آی به اندازه معرفی آیفون اپل در سال ۲۰۰۷ انقلابی بود. اکنون اما معرفی نوآوری جدید در هوش مصنوعی، بیشتر شبیه به‌روزرسانی گوشی‌های هوشمند، گاهی کاملا معمولی، به نظر می‌رسد.

به گزارش گروه آنلاین روزنامه دنیای اقتصاد؛ بحث‌های امروز فعالان حوزه فناوری درباره پیشرفت‌های نه‌چندان چشمگیر مدل‌های زبانی بزرگ (LLMs)، مشابه صحبت در مورد کندی نوآوری گوشی‌های هوشمند شده است. موج شگفتی ابتدایی چت‌جی‌پی‌تی شرکت اوپن‌ای‌آی به اندازه معرفی آیفون اپل در سال ۲۰۰۷ انقلابی بود. اکنون اما معرفی نوآوری جدید در هوش مصنوعی، بیشتر شبیه به‌روزرسانی گوشی‌های هوشمند گاهی کاملا معمولی، به نظر می‌رسد.

کاهش سرعت پیشرفت در هوش مصنوعی نشانه‌ای است از اینکه مدل‌های زبانی بزرگ به انتظارات ایجادشده پاسخ نداده‌اند. اکونومیست می‌نویسد شاید خبر مهم‌تر، ظهور جایگزین‌های کوچک‌تر و چابک‌تر مدل‌های زبانی است که مورد توجه کسب‌وکارها قرار گرفته‌اند. بسیاری از شرکت‌ها مدل‌های سفارشی را ترجیح می‌دهند که بتوانند آن‌ها را با نیازهای خاص خود هماهنگ کنند. این مدل‌های زبانی کوچک (SLMs) در مقایسه با مدل‌های زبانی بزرگ همه‌منظوره ارزان‌تر هستند و باعث شده همه‌کاره بودن مدل‌های زبانی بزرگ گاهی غیرضروری به نظر برسد. همان‌طور که دیوید کاکس، رئیس تحقیقات مدل‌های هوش مصنوعی در شرکت فناوری آی‌بی‌ام، می‌گوید: «ربات گفت‌وگوی منابع انسانی شما نیازی به دانستن فیزیک پیشرفته ندارد.»

علاوه بر این، مدل‌های زبانی کوچک به‌راحتی روی سیستم‌های فناوری اطلاعات داخلی شرکت‌ها یا تنها با کمک سرویس ابری اجرا می‌شوند. اندازه کوچک‌تر این مدل‌ها آن‌ها را به‌ویژه برای استفاده در گوشی‌های هوشمند، خودروهای خودران و ربات‌ها سازگار کرده است. اگر پیشرفت فعلی مدل‌های زبانی کوچک ادامه داشته باشد، می‌تواند مهر تاییدی بر تصمیم شرکت‌هایی مانند اپل برای عدم سرمایه‌گذاری کلان در مدل‌های زبانی بزرگ باشد.

دلیل دیگر محبوبیت رو به رشد مدل‌های زبانی کوچک، بعد اقتصادی آن است. شرکت‌ها از سرمایه‌گذاری‌های هنگفت روزهای اولیه معرفی هوش مصنوعی مولد فاصله گرفته و بر بازگشت سرمایه متمرکز شده‌اند. اکونومیست می‌نویسد اگرچه هنوز مدل‌های زبانی بزرگ می‌توانند مزیت خود را داشته باشند، اما استفاده از مدل‌های زبانی کوچک برای انجام کارهای مشخص و تکراری می‌تواند هزینه‌ها را کاهش دهد.

در حال حاضر کماکان بازار بر مدل‌های زبانی بزرگ متمرکز است. با وجود این که غول‌های ابری مانند مایکروسافت و گوگل مدل‌های بسیار کوچکی ساخته‌اند، باور به تداوم وضعیت موجود، هزینه‌های هنگفت لازم جهت آموزش و میزبانی مدل‌های زبانی بزرگ را توجیه‌پذیر کرده است. البته رویکرد غول‌های فناوری شاید زیاد دوام نداشته باشد. با توجه به مزایای نسبی مدل‌های زبانی کوچک، رویکرد محتاطانه اپل ممکن است در درازمدت موجه به نظر برسد.//