دانشگاه محمد بن زاید برای هوش مصنوعی (MBZUAI) در ابوظبی از مدل استدلالی جدیدی به نام K2 Think رونمایی کرده که با هدف ارائه عملکردی نزدیک به مدلهای پیشرفته موجود، اما با هزینههای آموزش بسیار کمتر توسعه یافته است. این گام تازه نشاندهنده تلاش امارات برای نفوذ بیشتر در عرصه جهانی هوش مصنوعی و رقابت با بازیگران بزرگ مانند OpenAI و آزمایشگاه چینی DeepSeek است.
پیشزمینه و انگیزه
اوایل سال جاری، DeepSeek با عرضه مدل استدلالی R1 با 671 میلیارد پارامتر توجه زیادی جلب کرد؛ مدلی که ادعا میکرد عملکردی در حد مدلهای بزرگ غربی ارائه میدهد اما با هزینههای آموزش پایینتر. در این میان MBZUAI و شریک تجاری آن، شرکت اماراتی G42 با پشتوانه مالی و فنی مایکروسافت، تصمیم گرفتند مدلی کارآمد و ارزانتر بسازند که K2 Think نتیجه این تلاش است.
مشخصات فنی و فناوریهای پایه
K2 Think با تنها 32 میلیارد پارامتر بهمراتب کوچکتر از رقبای خود است و روی نسخه متنباز Qwen 2.5 ساخت علیبابا بنا شده است. عملیات اجرا و ارزیابی این مدل بر روی سختافزار تولیدکننده چیپ هوش مصنوعی Cerebras انجام شده است. برای مقایسه، R1 حدود 671 میلیارد پارامتر دارد و OpenAI نیز جزئیات تعداد پارامترهای برخی از مدلهای خود را منتشر نکرده است.
ویژگیهای کلیدی محصول
- حجم مدل: 32 میلیارد پارامتر، طراحی شده برای کارایی با هزینه آموزشی کم
- پایه متنباز: استفاده از Qwen 2.5 بهعنوان چارچوب پایه
- سختافزار و اجرا: تست و اجرا بر روی پلتفرمهای Cerebras
- آموزش و بهینهسازی: استفاده از روشهای پیشرفته مثل زنجیره فکری نظارتشده و مقیاسبندی زمان آزمایش
- شاخصهای معیار: عملکرد رقابتی در بنچمارکهای ریاضی و علمی از جمله AIME24، AIME25، HMMT25، OMNI-Math-HARD، LiveCodeBenchv5 و GPQA-Diamond
چگونه به عملکرد بالاتر دست یافتند
هکتور لیو، مدیر مؤسسه مدلهای بنیادین در MBZUAI، توضیح داده است که تیم توسعه از مجموعهای از تکنیکها برای ارتقای قابلیتهای استدلالی مدل استفاده کردهاند. از جمله:
- زنجیره فکری طولانی نظارتشده (long chain-of-thought supervised fine-tuning) برای تقویت استدلال گامبهگام
- مقیاسبندی زمان اجرا (test-time scaling) که با تخصیص منابع محاسباتی اضافی در مرحله استنتاج، دقت و قابلیت عمومیسازی را افزایش میدهد
- رویکرد سیستمی به جای تمرکز صرف بر مدل منفرد؛ یعنی استقرار مداوم، پایش و بهروزرسانی مدل در محیطهای عملیاتی
به گفته لیو، ترکیب این روشها و تنظیمات سیستمی است که به K2 Think کمک کرده عملکردی در سطح مدلهای بزرگ ارائه دهد، هرچند هیچیک از گامها را بهتنهایی نمیتوان عامل اصلی موفقیت دانست.
مقایسه با رقبا
در حالی که DeepSeek و OpenAI از بازیگران کلیدی رقابتاند، رویکرد MBZUAI بیشتر بر ایجاد یک ابزار تخصصی و مقرونبهصرفه متمرکز است تا صرفاً ساخت یک چتبات عمومی. R1 با تعداد پارامتر بسیار بالا برای نشان دادن تواناییهای مقیاسپذیری شناخته میشود، اما K2 Think نشان میدهد که با بهکارگیری تکنیکهای آموزش و استنتاج هوشمند میتوان با مدلهای نسبتاً کوچک نیز به نتایج قابلتوجهی رسید.
مزایا نسبت به مدلهای بزرگتر
- هزینههای آموزش و نگهداری پایینتر
- نیاز کمتر به زیرساختهای عظیم محاسباتی که برای بسیاری از مؤسسات و کشورها قابلدسترس نیست
- امکان استقرار سریعتر و بهینهسازی تدریجی در محیطهای کاربردی
موارد کاربرد و تمرکز علمی
تیم توسعه تأکید میکند که هدف K2 Think ساخت یک چتبات عمومی مانند ChatGPT نیست؛ بلکه هدف ارائه یک ابزار تخصصی برای حل مسائل پیچیده در حوزههای ریاضی، علوم و برنامهنویسی است. ریچارد مورتون، مدیر مؤسسه مدلهای بنیادین MBZUAI، میگوید این مدل میتواند زمان لازم برای حل مسائل تحقیقاتی یا طراحی آزمایشهای بالینی را بهطور قابلتوجهی کاهش دهد؛ بهطوریکه به جای سالها تلاش انسانی، راهحلها همراه با شتاب و دقت بیشتری در دسترس قرار گیرند.
از جمله موارد کاربرد میتوان به تحلیل مسائل ریاضی پیشرفته، پشتیبانی از پژوهشهای علمی، تسریع در طراحی و تحلیل آزمایشهای بالینی، و بهبود ابزارهای کدنویسی اشاره کرد.
اهمیت بازار و چشمانداز ژئوپلیتیک
این حرکت MBZUAI تنها یک پیروزی فنی نیست، بلکه نشاندهنده تلاش منطقهای برای تقویت ظرفیتهای فناوری و کاهش وابستگی اقتصادی به نفت است. امارات با همکاری شرکتهایی مثل G42 و سرمایهگذاریهایی که منجر به همکاریهای بینالمللی مثل مشارکت با مایکروسافت شده، در تلاش است جایگاهی در زنجیره جهانی نوآوری بهدست آورد.
با این حال، امارات با رقابت نزدیک سعودیها و پیچیدگیهای ژئوپلیتیکی روبهرو است. سرمایهگذاریهای بینالمللی و ارتباطات شرکای خارجی، بهویژه نگرانیهایی مرتبط با روابط با چین، زیر ذرهبین نظارتهای بینالمللی قرار گرفته است. در مجموع، صنعت هوش مصنوعی امارات هنوز برای رسیدن به مقیاس شرکتهای بزرگ آمریکایی و چینی راه درازی دارد، اما پروژههایی مانند K2 Think نشان میدهند که این کشور بهسرعت در حال جلب توجه و سرمایهگذاری است.
جمعبندی: پیام برای صنعت و پژوهش
K2 Think نمونهای است از چگونگی دستیابی به عملکرد بالا از طریق تلفیق مهندسی مدل، بهینهسازیهای آموزشی و بهرهگیری از سختافزار مناسب. این پروژه نشان میدهد که نوآوری در معماری، روشهای آموزش و استنتاج میتواند فاصله میان مدلهای عظیم و مدلهای جمعوجور را کاهش دهد و فرصتهای جدیدی برای کشورها و سازمانهایی فراهم آورد که دسترسی به منابع عظیم محاسباتی ندارند. برای علاقهمندان به فناوری، پژوهش و کسبوکار، این تحولات شواهدی از حرکت اکوسیستم جهانی هوش مصنوعی به سمت تنوع در رویکردها و معماریها ارائه میدهد.

