سایت خبری
famaserver
  • صفحه نخست
  • تکنولوژی
  • علم و دانش
  • بازی
  • فناوری
  • اینترنت
  • موبایل
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

معرفی گیفت کارت آیتونز؛ کلید طلایی ورود به دنیای اپل

معرفی گیفت کارت آیتونز؛ کلید طلایی ورود به دنیای اپل

5 ماه پیش
با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

8 ماه پیش
معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

8 ماه پیش
جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

8 ماه پیش
شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

8 ماه پیش
آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

8 ماه پیش
وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

8 ماه پیش
قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

8 ماه پیش
چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

8 ماه پیش
کاهش 20 درصدی واردات تلفن همراه در 5 ماهه امسال

کاهش ۲۰ درصدی واردات تلفن همراه در ۵ ماهه امسال

8 ماه پیش

آیا ایلان ماسک در مورد توانایی‌های هوش مصنوعی گراک ۳ دروغ گفته است؟

زمان انتشار: 23 فوریه 2025 ساعت 14:33

دسته بندی: تکنولوژی

شناسه خبر: 895623

زمان مطالعه: 5 دقیقه

آیا ایلان ماسک در مورد توانایی‌های هوش مصنوعی گراک ۳ دروغ گفته است؟

آیا ایلان ماسک در مورد توانایی‌های هوش مصنوعی گراک ۳ دروغ گفته است؟

یکی از کارکنان OpenAI، شرکت xAI متعلق‌ به ایلان ماسک را به انتشار نتایج گمراه‌کننده درباره‌ی هوش مصنوعی Grok 3، متهم کرد؛ اما ایگور بابوشکین، یکی از بنیان‌گذاران xAI، تأکید دارد که این شرکت درست عمل کرده است.

xAI در وبلاگ خود نموداری منتشر کرد که عملکرد گراک ۳ را در آزمون AIME 2025 نشان می‌دهد؛ مجموعه‌ای از پرسش‌های ریاضی دشوار که از یک مسابقه‌ی ریاضی گردآوری شده‌اند. برخی کارشناسان درباره‌ی اعتبار AIME به‌عنوان معیاری برای سنجش هوش مصنوعی تردید دارند. بااین‌حال، AIME 2025 و نسخه‌های پیشین این آزمون معمولاً برای ارزیابی توانایی مدل‌ها در حل مسائل ریاضی استفاده می‌شوند.

در نمودار xAI، دو نسخه از گراک ۳، یعنی Grok 3 Reasoning Beta و Grok 3 mini Reasoning، عملکرد بهتری نسبت‌ به بهترین مدل فعلی OpenAI با نام o3-mini-high در آزمون AIME 2025 داشتند. بااین‌حال، کارکنان OpenAI در شبکه‌ی اجتماعی X اشاره کردند که نمودار xAI امتیاز مدل o3-mini-high را در حالت cons@64 برای آزمون AIME 2025 درج نکرده است.

cons@64 مخفف عبارت consensus@64 است که به مدل اجازه می‌دهد هر مسئله در آزمون را ۶۴ بار حل کند و پاسخی را که بیشترین تکرار را داشته باشد، به‌عنوان پاسخ نهایی انتخاب می‌کند. cons@64 معمولاً امتیاز مدل‌ها را در آزمون‌ها به میزان قابل‌ توجهی افزایش می‌دهد و حذف آن از نمودار می‌تواند باعث شود عملکرد یک مدل بهتر از دیگری به نظر برسد، درحالی‌که در واقعیت چنین نیست.

امتیازهای Grok 3 Reasoning Beta و Grok 3 mini Reasoning در آزمون AIME 2025 با معیار 1@ (اولین پاسخی که مدل‌ها ارائه داده‌اند) پایین‌تر از امتیاز مدل o3-mini-high است.

همچنین، Grok 3 Reasoning Beta با اختلافی جزئی پشت سر مدل o1 شرکت OpenAI قرار می‌گیرد که در حالت پردازشی medium تنظیم شده است. xAI همچنان Grok 3 را به‌عنوان «باهوش‌ترین هوش مصنوعی جهان» معرفی می‌کند.

مقاله‌های مرتبط
  • هوش مصنوعی بسیار پیشرفته گراک ۳ ایلان ماسک موقتا رایگان شد

  • هوش مصنوعی Grok 3 معرفی شد؛ پاسخ ایلان ماسک به GPT-4o و جمینای

بابوشکین استدلال می‌کند که OpenAI نیز پیش‌تر نمودارهایی با نتایج گمراه‌کننده منتشر کرده بود؛ البته آن نمودارها صرفاً عملکرد مدل‌های خود اوپن‌ای‌آی را مقایسه می‌کردند.

حتما بخوانید : زیبانک؛ نوآوری جدید بانک پاسارگاد در فین‌تک برای نسل آینده
اشتراک گذاری

اخبار مرتبط

  • نبرد غول پهپادسازی با دولت آمریکا؛ کار به دادگاه کشانده می‌شود
    نبرد غول پهپادسازی با دولت آمریکا؛ کار به دادگاه کشانده می‌شود 3 ماه پیش
  • ویدیو رسمی سامسونگ از نمایشگر ضد جاسوسی گوشی گلکسی اس ۲۶ اولترا
    ویدیو رسمی سامسونگ از نمایشگر ضد جاسوسی گوشی گلکسی اس ۲۶ اولترا 3 ماه پیش
  • درآمد گیمینگ اپ استور به ۵۲٫۵ میلیارد دلار رسید
    درآمد گیمینگ اپ استور به ۵۲٫۵ میلیارد دلار رسید 3 ماه پیش
  • اوپو گوشی تاشو جدیدی با دوربین ۲۰۰ مگاپیکسلی می‌سازد
    اوپو گوشی تاشو جدیدی با دوربین ۲۰۰ مگاپیکسلی می‌سازد 3 ماه پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • ارتباطات 160
  • امنیت 295
  • اینترنت 3435
  • بازی 8824
  • برنامه نویسی 34
  • تبلیغات 22
  • تکنولوژی 31916
  • دانش‌بنیان 1
  • رمز ارز 1252
  • سیستم عامل 237
  • شبکه اجتماعی 656
  • علم و دانش 14927
  • فناوری 7871
  • کاریکاتور 556
  • کسب و کار 708
  • موبایل 725
  • میزبانی وب 40
  • نرم افزار - سخت افزار 447

جدیدترین مقالات

  • گزینه‌های توسعه‌دهنده اندروید؛ تنظیمات پنهان برای افزایش سرعت گوشی
    گزینه‌های توسعه‌دهنده اندروید؛ تنظیمات پنهان برای افزایش سرعت گوشی 3 ماه پیش
  • iOS 26.3 منتشر شد؛ ۶ قابلیت جدید برای آیفون
    iOS 26.3 منتشر شد؛ ۶ قابلیت جدید برای آیفون 3 ماه پیش
  • اندروید ۱۷ بتا منتشر شد؛ تمرکز ویژه بر گوشی‌های تاشو
    اندروید ۱۷ بتا منتشر شد؛ تمرکز ویژه بر گوشی‌های تاشو 3 ماه پیش
  • رازهای اندروید؛ قابلیت‌هایی که استفاده از گوشی را ساده‌تر می‌کنند
    رازهای اندروید؛ قابلیت‌هایی که استفاده از گوشی را ساده‌تر می‌کنند 3 ماه پیش
  • بازگشت قابلیت جابه‌جایی نوار وظیفه به ویندوز ۱۱
    بازگشت قابلیت جابه‌جایی نوار وظیفه به ویندوز ۱۱ 3 ماه پیش

لینکهای پیشنهادی

سرور مجازی | خرید هاست | دانلود نرم افزار | کلاس آنلاین | رپورتاژ خارجی

میزبانی در هاست ویندوز فاماسرور