سایت خبری
famaserver
  • صفحه نخست
  • تکنولوژی
  • علم و دانش
  • بازی
  • فناوری
  • اینترنت
  • موبایل
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

معرفی گیفت کارت آیتونز؛ کلید طلایی ورود به دنیای اپل

معرفی گیفت کارت آیتونز؛ کلید طلایی ورود به دنیای اپل

6 ماه پیش
با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

8 ماه پیش
معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

8 ماه پیش
جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

8 ماه پیش
شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

8 ماه پیش
آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

8 ماه پیش
وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

8 ماه پیش
قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

8 ماه پیش
چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

8 ماه پیش
کاهش 20 درصدی واردات تلفن همراه در 5 ماهه امسال

کاهش ۲۰ درصدی واردات تلفن همراه در ۵ ماهه امسال

8 ماه پیش

هوش مصنوعی «زنده» می‌شود؛‌ یادگیری از تجربه‌های محیطی، بدون دخالت انسانی

زمان انتشار: 29 آوریل 2025 ساعت 6:31

دسته بندی: تکنولوژی

شناسه خبر: 915943

زمان مطالعه: 8 دقیقه

هوش مصنوعی «زنده» می‌شود؛‌ یادگیری از تجربه‌های محیطی، بدون دخالت انسانی

هوش مصنوعی «زنده» می‌شود؛‌ یادگیری از تجربه‌های محیطی، بدون دخالت انسانی

آیا روزی ماشین‌ها می‌توانند مانند انسان‌ها از تجربه‌هایشان یاد بگیرند؟ جامعه‌ی پژوهشگران هوش مصنوعی اخیراً تلاش کرده است فناوری‌های مولد (Generative) را فراتر از آزمون‌های ساده‌ای که مدل‌ها به‌راحتی از آن‌ها عبور می‌کنند، توسعه دهد.

مدل‌ها امروز آنقدر توانایی‌های مختلف کسب کرده‌اند که آزمون تورینگ به‌نوعی کارایی خود را از دست داده است. مدل‌های جدید حالا می‌توانند با تقلید از الگوهای زبانی انسان، از این آزمون عبور کنند، اما موفقیت آن‌ها لزوماً نشان‌دهنده‌ی درک واقعی یا هوشمندی عمیق نیست. این موضوع بحث‌ داغی را میان پژوهشگران ایجاد کرده است: آیا مدل‌های جدید صرفاً برای عبور از بنچمارک‌ها طراحی شده‌اند یا واقعاً هوشمندی لازم برای تولید نتایج فوق‌العاده را دارند؟

به‌گفته‌ی پژوهشگران دیپ‌مایند گوگل، آزمون‌ها مشکل اصلی نیستند، بلکه محدودیت امروز در روش‌های توسعه‌ی مدل‌های هوش مصنوعی است. داده‌های آموزشی این مدل‌ها بسیار محدود و ایستا هستند و معمولاً از مجموعه‌های ثابت متنی مانند ویکی‌پدیا یا کتاب‌ها تشکیل شده‌اند که نمی‌توانند با تغییرات و پویایی‌های دنیای واقعی هماهنگ شوند. همین محدودیت باعث می‌شود مدل‌ها نتوانند در مواجهه با موقعیت‌های جدید، دانش خود را به‌روزرسانی کنند.

محسن یزدانی

DeepMind گوگل و ۲۱ دانشمند برتر هوش مصنوعی که آن را پیش می‌برند

DeepMind گوگل و ۲۱ دانشمند برتر هوش مصنوعی که آن را پیش می‌برند
مطالعه ’11

پژوهشگران دیپ‌مایند در مقاله‌ای که ۱۱ آوریل ۲۰۲۵ منتشر شد و بخشی از کتاب در دست انتشار «طراحی یک هوش» از انتشارات MIT است، پیشنهاد کرده‌اند که هوش مصنوعی باید بتواند از طریق تعامل مستقیم با جهان واقعی، مانند دریافت بازخورد از محیط یا کاربران، تجربه کسب کند و اهداف خود را براساس سیگنال‌های محیطی تعیین کند. دیوید سیلوِر (David Silver) و ریچارد ساتِن (Richard Sutton)، پژوهشگران ارشد دیپ‌مایند، در این مقاله با عنوان «به عصر تجربه خوش آمدید» می‌نویسند:

توانایی‌های خارق‌العاده زمانی پدیدار می‌شوند که پتانسیل کامل یادگیری تجربی مورد استفاده قرار گیرد.

– دیوید سیلور و ریچارد ساتن، پژوهشگران ارشد دیپ‌مایند

این دو پژوهشگر از چهره‌های شاخص حوزه‌ی یادگیری ماشین هستند. سیلور به‌عنوان رهبر تیم توسعه‌دهنده‌ی آلفازِرو (AlphaZero) شناخته می‌شود؛ مدلی که در بازی‌های شطرنج و گو هوش انسانی را شکست داد. ساتن نیز یکی از خالقان یادگیری تقویتی (Reinforcement Learning) است؛ روشی که پایه‌ی ساخت آلفازِرو بود و جایزه‌ی تورینگ را برای او به ارمغان آورد.

یادگیری تقویتی در رباتیک برای آموزش ربات‌ها به انجام وظایف پیچیده، مانند جابه‌جایی اشیا، استفاده می‌شود

یادگیری تقویتی با مفاهیمی مانند یادگیری تفاوت زمانی، که به ماشین‌ها امکان پیش‌بینی پاداش‌های آینده را می‌داد، از دهه‌ی ۱۹۸۰ توسعه یافت. روش‌های کاوش، مانند الگوریتم‌های مبتنی بر کنجکاوی، به ماشین‌ها کمک کردند تا استراتژی‌های خلاقانه‌ای کشف کنند. در این روش، مدل با آزمون و خطا و دریافت بازخورد (پاداش یا جریمه) از محیط، رفتار خود را بهبود می‌بخشد.

به‌دلیل وابستگی زیاد به آزمون و خطا، یادگیری تقویتی نیاز به طراحی سیستم‌های پاداش پیچیده‌ای دارد که تنظیم آن‌ها در دنیای واقعی می‌تواند دشوار باشد، زیرا محیط‌های واقعی غیرقابل پیش‌بینی هستند و پیش‌بینی تمام پیامدهای یک اقدام دشوار است.

برای مثال، در یک سیستم خودران، تعیین پاداش مناسب برای هر اقدام (مانند ترمز کردن یا تغییر مسیر) نیاز به تحلیل دقیق و پیش‌بینی عواقب بلندمدت دارد، که در محیط‌های پویا و غیرقابل پیش‌بینی چالش‌برانگیز است.

رویکردی که سیلور و ساتن از آن دفاع می‌کنند، براساس یادگیری تقویتی و درس‌های آلفازِرو بنا شده و «جریان‌ها» (Streams) نام دارد. هدف آن رفع کاستی‌های مدل‌های زبانی بزرگ (مانند GPT) است که صرفاً برای پاسخگویی به سؤالات تک‌جمله‌ای طراحی شده‌اند. این دو پژوهشگر اشاره می‌کنند که پس از موفقیت آلفازِرو و مدل پیشین آن، آلفاگو، نسل جدید هوش‌های مصنوعی مولد مانند GPT ظهور کردند و یادگیری تقویتی به نوعی کنار گذاشته شد. این تغییر هم مزایا و هم معایبی داشت.

حتما بخوانید : آیفون ۱۷ یک‌ قدم به رونمایی نزدیک‌تر شد
اشتراک گذاری

اخبار مرتبط

  • نبرد غول پهپادسازی با دولت آمریکا؛ کار به دادگاه کشانده می‌شود
    نبرد غول پهپادسازی با دولت آمریکا؛ کار به دادگاه کشانده می‌شود 4 ماه پیش
  • ویدیو رسمی سامسونگ از نمایشگر ضد جاسوسی گوشی گلکسی اس ۲۶ اولترا
    ویدیو رسمی سامسونگ از نمایشگر ضد جاسوسی گوشی گلکسی اس ۲۶ اولترا 4 ماه پیش
  • درآمد گیمینگ اپ استور به ۵۲٫۵ میلیارد دلار رسید
    درآمد گیمینگ اپ استور به ۵۲٫۵ میلیارد دلار رسید 4 ماه پیش
  • اوپو گوشی تاشو جدیدی با دوربین ۲۰۰ مگاپیکسلی می‌سازد
    اوپو گوشی تاشو جدیدی با دوربین ۲۰۰ مگاپیکسلی می‌سازد 4 ماه پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • ارتباطات 160
  • امنیت 295
  • اینترنت 3435
  • بازی 8824
  • برنامه نویسی 34
  • تبلیغات 23
  • تکنولوژی 31916
  • دانش‌بنیان 1
  • رمز ارز 1252
  • سیستم عامل 237
  • شبکه اجتماعی 656
  • علم و دانش 14927
  • فناوری 7871
  • کاریکاتور 556
  • کسب و کار 708
  • موبایل 725
  • میزبانی وب 40
  • نرم افزار - سخت افزار 447

جدیدترین مقالات

  • نقش رم در بهبود پاسخ‌گویی دیتابیس‌های سنگین
    نقش رم در بهبود پاسخ‌گویی دیتابیس‌های سنگین 5 روز پیش
  • گزینه‌های توسعه‌دهنده اندروید؛ تنظیمات پنهان برای افزایش سرعت گوشی
    گزینه‌های توسعه‌دهنده اندروید؛ تنظیمات پنهان برای افزایش سرعت گوشی 4 ماه پیش
  • iOS 26.3 منتشر شد؛ ۶ قابلیت جدید برای آیفون
    iOS 26.3 منتشر شد؛ ۶ قابلیت جدید برای آیفون 4 ماه پیش
  • اندروید ۱۷ بتا منتشر شد؛ تمرکز ویژه بر گوشی‌های تاشو
    اندروید ۱۷ بتا منتشر شد؛ تمرکز ویژه بر گوشی‌های تاشو 4 ماه پیش
  • رازهای اندروید؛ قابلیت‌هایی که استفاده از گوشی را ساده‌تر می‌کنند
    رازهای اندروید؛ قابلیت‌هایی که استفاده از گوشی را ساده‌تر می‌کنند 4 ماه پیش

لینکهای پیشنهادی

فاماسرور |  دانلود نرم افزار | کلاس آنلاین | رپورتاژ خارجی

میزبانی در هاست ویندوز فاماسرور