سایت خبری
famaserver
  • صفحه نخست
  • تکنولوژی
  • علم و دانش
  • بازی
  • فناوری
  • اینترنت
  • موبایل
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

2 ماه پیش
معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

2 ماه پیش
جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

2 ماه پیش
شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

2 ماه پیش
آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

2 ماه پیش
وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

2 ماه پیش
قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

2 ماه پیش
چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

2 ماه پیش
کاهش 20 درصدی واردات تلفن همراه در 5 ماهه امسال

کاهش ۲۰ درصدی واردات تلفن همراه در ۵ ماهه امسال

2 ماه پیش
۵ عادت مخرب که گوشی هوشمند شما را نابود می‌کند

۵ عادت مخرب که گوشی هوشمند شما را نابود می‌کند

2 ماه پیش

مدل هوش مصنوعی Maverick متا در بنچمارک‌های مستقل از رقبایش شکست خورد

زمان انتشار: 12 آوریل 2025 ساعت 18:42

دسته بندی: تکنولوژی

شناسه خبر: 910588

زمان مطالعه: 4 دقیقه

مدل هوش مصنوعی Maverick متا در بنچمارک‌های مستقل از رقبایش شکست خورد

مدل هوش مصنوعی Maverick متا در بنچمارک‌های مستقل از رقبایش شکست خورد

مدل هوش مصنوعی Maverick متا که به‌عنوان نسخه‌ای جدید و آزمایشی از خانواده‌ی Llama 4 معرفی شد، در کانون توجه قرار گرفت، اما نه به دلیلی که متا انتظار داشت. اوایل این هفته مشخص شد که متا برای کسب امتیاز بالا در بنچمارک LM Arena، از نسخه‌ی آزمایشی و منتشرنشده‌ی مدل Maverick استفاده کرده است. این اقدام LM Arena را به عذرخواهی رسمی و تغییر سیاست‌هایش وادار کرد تا امتیازدهی را بر اساس نسخه‌ی اصلی و دست‌نخورده‌ی مدل‌های هوش مصنوعی ثبت کند.

به گفته‌ی ‌Piɡeσn، نسخه‌ی رسمی مدل جدید متا با نام کامل Llama-4-Maverick-17B-128E-Instruct، در رده‌ای پایین‌تر از مدل‌های رقبا ازجمله GPT-4o ،Claude 3.5 Sonnet و جمینای ۱٫۵ پرو قرار گرفت؛ مدل‌هایی که بسیاری از آن‌ها چند ماه قبل معرفی شده‌اند.

اما چرا Maverick اصلی چنین عملکرد ضعیفی داشت؟ به‌گفته‌ی متا، نسخه‌ی آزمایشی مدل که با نام Llama-4-Maverick-03-26-Experimental شناخته می‌شود، برای مکالمه بهینه‌سازی شده بود. این بهینه‌سازی‌ها ظاهراً در LM Arena مؤثر واقع شدند، زیرا در این پلتفرم انسان‌ها پاسخ مدل‌ها را مقایسه و بهترین را انتخاب می‌کنند.

مقاله‌های مرتبط:
  • نتایج یک تحقیق: عملکرد مدل‌های هوش مصنوعی متا بهتر از واقعیت جلوه داده شده است

  • متا ادعای دست‌کاری عمدی در نتایج بنچمارک هوش مصنوعی Llama 4 را رد کرد

پلتفرم LM Arena به دلایل مختلف هرگز معیار مطمئنی برای سنجش عملکرد واقعی مدل‌های هوش مصنوعی محسوب نمی‌شود. بهینه‌سازی مدل‌های هوش مصنوعی صرفاً برای موفقیت در بنچمارک خاص، علاوه‌بر اینکه گمراه‌کننده است، کار توسعه‌دهندگان را برای درک دقیق عملکرد مدل در سناریوهای مختلف دشوار می‌کند.

حتما بخوانید : اولویت‌های جدید OpenAI در توسعه محصولات؛ ایمنی قربانی سرعتِ پیشرفت می‌شود؟
اشتراک گذاری

اخبار مرتبط

  • ادعای سم‌موبایل: بتای One UI 8.5 سامسونگ همین‌ امروز منتشر می‌شود
    ادعای سم‌موبایل: بتای One UI 8.5 سامسونگ همین‌ امروز منتشر می‌شود 32 دقیقه پیش
  • این مانیتور گیمینگ ۲۷ اینچی نرخ نوسازی چشمگیر ۴۰۰ هرتزی دارد
    این مانیتور گیمینگ ۲۷ اینچی نرخ نوسازی چشمگیر ۴۰۰ هرتزی دارد 32 دقیقه پیش
  • برنامه ضبط صدای سامسونگ با One UI 8.5 بازطراحی می‌شود
    برنامه ضبط صدای سامسونگ با One UI 8.5 بازطراحی می‌شود 32 دقیقه پیش
  • افزایش قیمت بنزین کارت جایگاه به ۵ هزار تومان از ۲۲ آذر اعمال می‌شود
    افزایش قیمت بنزین کارت جایگاه به ۵ هزار تومان از ۲۲ آذر اعمال می‌شود 32 دقیقه پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • ارتباطات 160
  • امنیت 293
  • اینترنت 3435
  • بازی 8814
  • برنامه نویسی 34
  • تبلیغات 21
  • تکنولوژی 29740
  • دانش‌بنیان 1
  • رمز ارز 1252
  • سیستم عامل 205
  • شبکه اجتماعی 625
  • علم و دانش 14927
  • فناوری 7443
  • کاریکاتور 556
  • کسب و کار 674
  • موبایل 724
  • میزبانی وب 40
  • نرم افزار - سخت افزار 414

جدیدترین مقالات

  • ادعای سم‌موبایل: بتای One UI 8.5 سامسونگ همین‌ امروز منتشر می‌شود
    ادعای سم‌موبایل: بتای One UI 8.5 سامسونگ همین‌ امروز منتشر می‌شود 4 ساعت پیش
  • این مانیتور گیمینگ ۲۷ اینچی نرخ نوسازی چشمگیر ۴۰۰ هرتزی دارد
    این مانیتور گیمینگ ۲۷ اینچی نرخ نوسازی چشمگیر ۴۰۰ هرتزی دارد 4 ساعت پیش
  • برنامه ضبط صدای سامسونگ با One UI 8.5 بازطراحی می‌شود
    برنامه ضبط صدای سامسونگ با One UI 8.5 بازطراحی می‌شود 4 ساعت پیش
  • افزایش قیمت بنزین کارت جایگاه به ۵ هزار تومان از ۲۲ آذر اعمال می‌شود
    افزایش قیمت بنزین کارت جایگاه به ۵ هزار تومان از ۲۲ آذر اعمال می‌شود 4 ساعت پیش
  • ویوو بالاخره تاریخ رونمایی S50 و S50 پرو مینی را اعلام کرد
    ویوو بالاخره تاریخ رونمایی S50 و S50 پرو مینی را اعلام کرد 4 ساعت پیش

لینکهای پیشنهادی

سرور مجازی | خرید هاست | دانلود نرم افزار | کلاس آنلاین | رپورتاژ خارجی

میزبانی در هاست ویندوز فاماسرور