سایت خبری
famaserver
  • صفحه نخست
  • تکنولوژی
  • علم و دانش
  • بازی
  • فناوری
  • اینترنت
  • موبایل
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

2 ماه پیش
معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

2 ماه پیش
جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

2 ماه پیش
شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

2 ماه پیش
آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

2 ماه پیش
وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

2 ماه پیش
قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

2 ماه پیش
چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

2 ماه پیش
کاهش 20 درصدی واردات تلفن همراه در 5 ماهه امسال

کاهش ۲۰ درصدی واردات تلفن همراه در ۵ ماهه امسال

2 ماه پیش
۵ عادت مخرب که گوشی هوشمند شما را نابود می‌کند

۵ عادت مخرب که گوشی هوشمند شما را نابود می‌کند

2 ماه پیش

نتایج یک تحقیق: عملکرد مدل‌های هوش مصنوعی متا بهتر از واقعیت جلوه داده شده است

زمان انتشار: 7 آوریل 2025 ساعت 14:37

دسته بندی: تکنولوژی

شناسه خبر: 908833

زمان مطالعه: 3 دقیقه

نتایج یک تحقیق: عملکرد مدل‌های هوش مصنوعی متا بهتر از واقعیت جلوه داده شده است

نتایج یک تحقیق: عملکرد مدل‌های هوش مصنوعی متا بهتر از واقعیت جلوه داده شده است

یکی از مدل‌های هوش مصنوعی جدید متا به‌نام Maverick در آزمون LM Arena رتبه‌ی دوم را کسب کرد. این آزمون از سوی ارزیابان انسانی انجام شده است که خروجی مدل‌ها را مقایسه و نتایج خود را اعلام می‌کنند.

اکنون به نظر می‌رسد نسخه‌ای از Maverick که متا در LM Arena به کار گرفته، با نسخه‌ای که برای توسعه‌دهندگان ارائه شده، متفاوت است.

چندین محقق هوش مصنوعی در شبکه‌ی اجتماعی ایکس اشاره کردند که متا در بیانیه‌اش گفته نسخه‌ای که در LM Arena استفاده شده، نسخه‌ای آزمایشی مخصوص مکالمه است.

نموداری در وب‌سایت رسمی Llama نشان می‌دهد که آزمایش‌های LM Arena با استفاده از نسخه‌ی Llama 4 Maverick و «بهینه‌سازی‌شده برای مکالمه» انجام شده است.

مقاله‌های مرتبط
  • متا Llama 4 را معرفی کرد؛ هوش مصنوعی واتساپ و اینستاگرام، قوی‌تر از مدل‌های گوگل و OpenAI

  • کاربردی‌ ترین و بهترین ابزارهای هوش مصنوعی در سال ۲۰۲۵ برای همه

اگر مدلی برای یک آزمون خاص تنظیم شود و نسخه‌ی معمولی‌اش در اختیار کاربران قرار بگیرد، توسعه‌دهندگان نمی‌توانند دقیقاً عملکرد مدل را در زمینه‌های مختلف پیش‌بینی کنند؛ موضوعی که می‌تواند گمراه‌کننده باشد. آزمون‌های ارزیابی، هرچند ناکافی، باید تصویری کلی از نقاط قوت و ضعف مدل را در طیف وسیعی از وظایف ارائه دهند.

متا هنوز به یافته‌ی جدید محققان واکنشی نشان نداده است.

حتما بخوانید : گلکسی S23 اولترا و S24 اولترا با نسخه نهایی One UI 7 رؤیت شدند
اشتراک گذاری

اخبار مرتبط

  • چگونه کارت بانکی خود را مسدود کنیم؟ روش‌های آنلاین و بدون مراجعه به بانک
    چگونه کارت بانکی خود را مسدود کنیم؟ روش‌های آنلاین و بدون مراجعه به بانک 24 ساعت پیش
  • دیکشنری مریام-وبستر واژه سال ۲۰۲۵ را اعلام کرد
    دیکشنری مریام-وبستر واژه سال ۲۰۲۵ را اعلام کرد 24 ساعت پیش
  • خواهر رهبر کره شمالی با یک گوشی لوکس چینی دیده شد
    خواهر رهبر کره شمالی با یک گوشی لوکس چینی دیده شد 24 ساعت پیش
  • نرخ عوارض آزادراهی کشور تا ۱۲۰ درصد افزایش یافت
    نرخ عوارض آزادراهی کشور تا ۱۲۰ درصد افزایش یافت 24 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • ارتباطات 160
  • امنیت 293
  • اینترنت 3435
  • بازی 8814
  • برنامه نویسی 34
  • تبلیغات 21
  • تکنولوژی 30131
  • دانش‌بنیان 1
  • رمز ارز 1252
  • سیستم عامل 210
  • شبکه اجتماعی 632
  • علم و دانش 14927
  • فناوری 7523
  • کاریکاتور 556
  • کسب و کار 686
  • موبایل 724
  • میزبانی وب 40
  • نرم افزار - سخت افزار 424

جدیدترین مقالات

  • رمز موفقیت تریدرها با سرور مجازی فرانسه (پینگ پایین، امنیت بالا)
    رمز موفقیت تریدرها با سرور مجازی فرانسه (پینگ پایین، امنیت بالا) 1 روز پیش
  • تکنولوژی‌های هوشمند در اینورترهای اینوت و نقش آن‌ها در بهینه‌سازی مصرف انرژی در صنایع
    تکنولوژی‌های هوشمند در اینورترهای اینوت و نقش آن‌ها در بهینه‌سازی مصرف انرژی در صنایع 1 روز پیش
  • قیمت امروز آهن آلات
    قیمت امروز آهن آلات 1 روز پیش
  • نمایندگی مبل ترکیه در تهران
    نمایندگی مبل ترکیه در تهران 1 روز پیش
  • کرج میزبان رویداد بزرگ «فناوری‌های دیجیتال در صنعت» شد
    کرج میزبان رویداد بزرگ «فناوری‌های دیجیتال در صنعت» شد 1 روز پیش

لینکهای پیشنهادی

سرور مجازی | خرید هاست | دانلود نرم افزار | کلاس آنلاین | رپورتاژ خارجی

میزبانی در هاست ویندوز فاماسرور