هاست پرسرعت
تکنولوژی

شیائومی مدل هوش مصنوعی متن‌باز برای رقابت با OpenAI معرفی کرد

شیائومی مدل هوش مصنوعی متن‌باز برای رقابت با OpenAI معرفی کرد

شیائومی بی‌سروصدا با معرفی MiMo-7B، اولین مدل هوش مصنوعی متن‌باز در دسترس عموم خود، وارد فضای مدل‌های زبانی بزرگ (LLM) شد.

MiMo-7B محصول تیم تازه تأسیس شیائومی به‌نام Big Model Core Team است و به‌طور خاص بر وظایف نیازمند استدلال سنگین تمرکز دارد و طبق ادعای شیائومی در استدلال ریاضی و تولید کد، از رقبایی چون OpenAI و علی‌بابا عملکرد بهتری دارد.

MiMo-7B یک مدل هفت میلیارد پارامتری است. با وجود اندازه‌ی به‌مراتب کوچک‌تر نسبت‌به اکثر مدل‌های زبانی بزرگ رده‌بالا، شیائومی ادعا می‌کند عملکردش با مدل‌های حجیم‌تر، از جمله o1-mini متعلق به OpenAI و Qwen-32B-Preview از علی‌بابا، برابری می‌کند؛ هر سه مدل توانایی استدلال دارند.

شیائومی می‌گوید دیتاست متراکمی از ۲۰۰ میلیارد توکن استدلالی گردآوری کرده و در مجموع ۲۵ تریلیون توکن را طی سه مرحله به مدل آموزش داده است.

شیائومی به‌جای روش استاندارد پیش‌بینی توکن بعدی، از هدف پیش‌بینی چندتوکنی استفاده کرده و مدعی است این کار زمان استنتاج را بدون کاهش کیفیت خروجی، کوتاه می‌کند.

فرایند پس‌آموزش شامل ترکیبی از تکنیک‌های یادگیری تقویتی (RL) و بهبودهای زیرساختی می‌شود. شیائومی از الگوریتم سفارشی RL به‌نام Test Difficulty Driven Reward برای وظایف پیچیده استفاده کرد و روش Easy Data Re-Sampling برای پایدارسازی آموزش پیاده‌سازی شد.

شیائومی سیستم Seamless Rollout را برای کاهش زمان بیکاری GPU طی آموزش و اعتبارسنجی طراحی کرد که طبق ادعای شیائومی، بهبود ۲٫۲۹ برابری سرعت آموزش و جهش تقریباً ۲ برابری عملکرد اعتبارسنجی را به‌همراه داشته است.

چهار نسخه‌ی عمومی از MiMo-7B دردسترس قرار گرفته است: Base (مدل خام پیش‌آموزش‌دیده)، SFT (تنظیم دقیق با داده‌های نظارت‌شده)، RL-Zero (یادگیری تقویتی از پایه) و RL (مدل بهبودیافته مبتنی‌بر نسخه‌ی SFT با بالاترین دقت ادعاشده).

مقاله‌ی مرتبط
  • هوش مصنوعی چطور کار می‌کند؟ طرز کار مدل‌های زبانی بزرگ به زبان ساده

شیائومی برای ادعاهای خود، چند بنچمارک منتشر کرده؛ نسخه‌ی MiMo-7B-RL در ریاضی امتیاز ۹۵٫۸ در MATH-500 و در AIME 2024 بیش از ۶۸ امتیاز کسب کرد. در کدنویسی، امتیازش در LiveCodeBench v5 برابر ۵۷٫۸ و در نسخه‌ی ۶ کمتر از ۵۰ است.

مدل MiMo-7B هم‌اکنون با مجوز متن‌باز در Hugging Face دردسترس قرار گرفته است.

نمایش بیشتر
دانلود نرم افزار

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا