سایت خبری
famaserver
  • صفحه نخست
  • تکنولوژی
  • علم و دانش
  • بازی
  • فناوری
  • اینترنت
  • موبایل
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

2 ماه پیش
معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

2 ماه پیش
جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

2 ماه پیش
شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

2 ماه پیش
آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

2 ماه پیش
وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

2 ماه پیش
قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

2 ماه پیش
چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

2 ماه پیش
کاهش 20 درصدی واردات تلفن همراه در 5 ماهه امسال

کاهش ۲۰ درصدی واردات تلفن همراه در ۵ ماهه امسال

2 ماه پیش
۵ عادت مخرب که گوشی هوشمند شما را نابود می‌کند

۵ عادت مخرب که گوشی هوشمند شما را نابود می‌کند

2 ماه پیش

پیشرفته‌ترین مدل هوش مصنوعی تنها ۶۹ درصد دقت دارد؛ یافته محققان گوگل

زمان انتشار: 14 دسامبر 2025 ساعت 11:01

دسته بندی: تکنولوژی

شناسه خبر: 972645

زمان مطالعه: 4 دقیقه

پیشرفته‌ترین مدل هوش مصنوعی تنها ۶۹ درصد دقت دارد؛ یافته محققان گوگل

پیشرفته‌ترین مدل هوش مصنوعی تنها ۶۹ درصد دقت دارد؛ یافته محققان گوگل

گوگل تصویری نگران‌کننده از میزان دقت هوش مصنوعی در بیان حقایق به دست آورد. گوگل دیپ‌مایند هفته‌ی گذشته از مجموعه‌ی بنچمارک FACTS رونمایی کرد؛ ابزاری برای سنجش اعتبار و درستی پاسخ‌های مدل‌های AI.

این بنچمارک مدل‌ها را در چهار حوزه‌ی کلیدی به چالش می‌کشد: پاسخ به پرسش‌های واقعی بر اساس دانش درونی، استفاده‌ی مؤثر از جست‌وجوی وب، استناد دقیق به اسناد طولانی و تفسیر تصاویر. در این آزمون، جمنای ۳ پرو گوگل با کسب امتیاز ۶۹ درصد، بهترین عملکرد را به ثبت رساند؛ درحالی‌که سایر مدل‌های پیشرو با اختلاف فاحشی پایین‌تر از این سطح قرار گرفتند.

آمار مذکور باید زنگ خطری جدی برای کسب‌وکارهایی باشد که روی هوش مصنوعی شرط بسته‌اند. اگرچه مدل‌ها در سرعت و شیوایی کلام بی‌نظیرند؛ اما قابلیت اطمینان آن‌ها در بیان حقایق همچنان فرسنگ‌ها با انتظارات انسانی فاصله دارد؛ به‌ویژه در وظایفی که نیازمند دانش تخصصی، استدلال پیچیده یا استناد دقیق به منابع هستند.

مقاله‌های مرتبط
  • هوش مصنوعی چطور کار می‌کند؟ طرز کار مدل‌های زبانی بزرگ به زبان ساده

  • کاربردی‌ ترین و بهترین ابزارهای هوش مصنوعی در سال ۲۰۲۵ برای همه

حتی خطاهای واقعی کوچک در صنایعی مانند امور مالی، بهداشت و درمان و حقوق می‌توانند پیامدهای ویرانگری به‌همراه داشته باشند. یکی از خبرنگاران روایت می‌کند که چگونه یک شرکت حقوقی، کارمندش را به دلیل استفاده از ChatGPT در تنظیم لایحه‌ای که مملو از پرونده‌های ساختگی بود، اخراج کرد.

بنچمارک FACTS هم هشدار است و هم نقشه‌ی راه؛ گوگل امید دارد با کاهش نقاط شکست و نحوه‌ی خطای مدل‌ها، پیشرفت در این حوزه را شتاب ببخشد. اما فعلاً پیام روشن است: هوش مصنوعی بهتر می‌شود؛ اما همچنان در حدود یک‌سوم موارد اشتباه می‌کند.

حتما بخوانید : تعرفه مکالمه و پیامک همراه اول ۳۰ درصد گران شد
اشتراک گذاری

اخبار مرتبط

  • ویژگی‌های آپدیت ۲۰۲۶ آیفون لو رفت
    ویژگی‌های آپدیت ۲۰۲۶ آیفون لو رفت 12 ساعت پیش
  • رونمایی از دستیار هوش مصنوعی مدیران در CRM پیام‌گستر
    رونمایی از دستیار هوش مصنوعی مدیران در CRM پیام‌گستر 12 ساعت پیش
  • استفاده از کارت جایگاه گران‌تر شد؛ جزئیات جدید تغییر قیمت بنزین
    استفاده از کارت جایگاه گران‌تر شد؛ جزئیات جدید تغییر قیمت بنزین 12 ساعت پیش
  • آمار فوتی‌های آنفولانزا از مرز ۱۰۰ نفر گذشت؛ روند ابتلا همچنان صعودی است
    آمار فوتی‌های آنفولانزا از مرز ۱۰۰ نفر گذشت؛ روند ابتلا همچنان صعودی است 12 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • ارتباطات 160
  • امنیت 293
  • اینترنت 3435
  • بازی 8814
  • برنامه نویسی 34
  • تبلیغات 21
  • تکنولوژی 29981
  • دانش‌بنیان 1
  • رمز ارز 1252
  • سیستم عامل 207
  • شبکه اجتماعی 631
  • علم و دانش 14927
  • فناوری 7499
  • کاریکاتور 556
  • کسب و کار 682
  • موبایل 724
  • میزبانی وب 40
  • نرم افزار - سخت افزار 420

جدیدترین مقالات

  • هوشمندسازی شبکه با سوئیچ نکسوس؛ از کنترل دستی تا خودکارسازی کامل
    هوشمندسازی شبکه با سوئیچ نکسوس؛ از کنترل دستی تا خودکارسازی کامل 12 ساعت پیش
  • راهنمای کامل انتخاب هدایای تبلیغاتی دیجیتال؛ از پاوربانک تا فلش مموری
    راهنمای کامل انتخاب هدایای تبلیغاتی دیجیتال؛ از پاوربانک تا فلش مموری 12 ساعت پیش
  • نحوه پیدا کردن افراد در اینستاگرام با شماره تلفن
    نحوه پیدا کردن افراد در اینستاگرام با شماره تلفن 12 ساعت پیش
  • هاست اقتصادی چیست؟ راهنمای خرید هاست ارزان با کیفیت و امنیت بالا
    هاست اقتصادی چیست؟ راهنمای خرید هاست ارزان با کیفیت و امنیت بالا 12 ساعت پیش
  • رمز موفقیت تریدرها با سرور مجازی فرانسه (پینگ پایین، امنیت بالا)
    رمز موفقیت تریدرها با سرور مجازی فرانسه (پینگ پایین، امنیت بالا) 12 ساعت پیش

لینکهای پیشنهادی

سرور مجازی | خرید هاست | دانلود نرم افزار | کلاس آنلاین | رپورتاژ خارجی

میزبانی در هاست ویندوز فاماسرور