سایت خبری
famaserver
  • صفحه نخست
  • تکنولوژی
  • علم و دانش
  • بازی
  • فناوری
  • اینترنت
  • موبایل
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

معرفی گیفت کارت آیتونز؛ کلید طلایی ورود به دنیای اپل

معرفی گیفت کارت آیتونز؛ کلید طلایی ورود به دنیای اپل

6 ماه پیش
با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

8 ماه پیش
معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

8 ماه پیش
جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

8 ماه پیش
شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

8 ماه پیش
آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

8 ماه پیش
وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

8 ماه پیش
قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

8 ماه پیش
چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

8 ماه پیش
کاهش 20 درصدی واردات تلفن همراه در 5 ماهه امسال

کاهش ۲۰ درصدی واردات تلفن همراه در ۵ ماهه امسال

8 ماه پیش

هوش مصنوعی با شعر فریب می‌خورد و محدودیت‌های ایمنی‌اش را کنار می‌گذارد

زمان انتشار: 2 دسامبر 2025 ساعت 11:03

دسته بندی: تکنولوژی

شناسه خبر: 971174

زمان مطالعه: 6 دقیقه

هوش مصنوعی با شعر فریب می‌خورد و محدودیت‌های ایمنی‌اش را کنار می‌گذارد

هوش مصنوعی با شعر فریب می‌خورد و محدودیت‌های ایمنی‌اش را کنار می‌گذارد

شعر‌ها به‌دلیل ساختار خود برای انسان‌ها بسیار لذت‌بخش هستند؛ اما ظاهراً گاهی اوقات عملکرد امنیتی مدل‌های هوش مصنوعی را دچار اختلال می‌کنند.

محققان آزمایشگاه ایکارو (Icaro Lab) در ایتالیا، به‌منظور سنجش محدودیت‌های ایمنی هوش مصنوعی، ۲۰ شعر به زبان‌های ایتالیایی و انگلیسی نوشتند که همه‌ی آن‌ها با درخواست صریح برای تولید محتوای مضر و نفرت‌پراکنانه به‌پایان می‌رسیدند.

محققان فهمیدند که مدل‌های هوش مصنوعی نمی‌توانند محتواهای شعر‌ها را به‌طور دقیق پیش‌بینی کنند و همین عامل برای تولید پاسخ‌های مضر کافی است. به‌طور ساده‌تر، هوش مصنوعی با شعر فریب می‌خورد و محدودیت‌های ایمنی‌اش را کنار می‌گذارد.

محققان تمام ۲۰ شعر را روی ۲۵ مدل هوش مصنوعی معروف از جمله ChatGPT، جمنای، دیپ‌سیک و Claude آزمایش کردند. این مدل‌ها در نهایت به ۶۲ درصد از پرامپت‌های شاعرانه با محتوای مضر، پاسخ دادند و محدودیت‌های امنیتی‌شان را دور زدند.

برخی مدل‌های عملکرد بهتری نسبت‌به بقیه داشتند. برای مثال، GPT-5 nano به هیچ‌یک از شعر‌ها با محتوای مضر پاسخ نداد. از سوی دیگر، Gemini 2.5 pro بدترین عملکرد را داشت و به همه‌ی شعر‌ها پاسخ داد. مقامات گوگل در گذشته گفته بودند که مدام فیلتر‌های امنیتی هوش مصنوعی خود را بهبود می‌دهند و به‌احتمال زیاد در آینده با شعر‌های مضر هم مقابله خواهند کرد.

شعر‌هایی که محققان نوشته بودند شامل انواعی از محتوای مضر نظیر آموزش ساخت سلاح یا مواد منفجره از مواد شیمیایی، بیولوژیکی، رادیولوژیکی و هسته‌ای می‌شدند. علاوه‌بر‌این، موضوعاتی مانند سخنان نفرت‌پراکنانه، محتوای جنسی، خودکشی و خودآزاری نیز در متن شعر‌ها وجود داشت.

محققان شعر‌هایی را که برای دور زدن محدودیت‌های ایمنی هوش مصنوعی نوشته بودند منتشر نکردند، زیرا تکرار و الگوبرداری از آن‌ها بسیار ساده است.

ظاهراً ساختار امنیتی مدل‌های هوش مصنوعی محتمل‌ترین کلمه‌ی بعدی هر پرامپت را پیش‌بینی می‌کنند و از این طریق جلوی ارائه‌ی پاسخ‌های مضر را می‌گیرد. شعر‌ها ساختار نامشخص و غیرقابل‌ پیش‌بینی دارند و همین مورد شناسایی درخواست‌های مضر را دشوار می‌کند.

محققان نام چنین پرامپت‌هایی را Adversarial poetry (شعر خصمانه) گذاشته‌اند و می‌گویند توسط هر کسی قابل انجام هستند. چنین چیزی یعنی مدل‌های هوش مصنوعی اکنون یک ضعف جدی و آشکار دارند.

محقق‌ها قبل از انتشار نتیجه‌ی آزمایش خود، تمام شرکت‌‌های مورد مطالعه را از آسیب‌پذیری مدل‌های هوش مصنوعی‌شان مطلع کردند و داده‌ها را با آن‌ها به‌اشتراک گذاشتند. درحال حاضر فقط انتروپیک پاسخ داده و می‌گوید درحال بررسی نتایج آزمایش است.

مقاله‌های مرتبط
  • هوش مصنوعی فوق پیشرفته ChatGPT نمی‌‌تواند ساعت را به شما بگوید

  • کاربردی‌ ترین و بهترین ابزارهای هوش مصنوعی در سال ۲۰۲۵ برای همه

دو مدل هوش مصنوعی متا هم در آزمایش حضور داشتند و هر دو به ۷۰ درصد از پرامپت‌های شاعرانه پاسخ دادند. متا و سایر شرکت‌ها هنوز هیچ اعلامیه‌‌ای درباره‌ی آسیب‌پذیری اخیر منتشر نکرده‌اند.

محققان آزمایشگاه ایکارو قصد دارند در هفته‌ی آینده آزمایش‌های جدیدی انجام بدهد و احتمالاً با شاعر‌های واقعی و حرفه‌ای همکاری خواهند کرد.

حتما بخوانید : انویدیا با سرمایه‌گذاری ۲ میلیارد دلاری، نفوذش در طراحی تراشه را تقویت کرد
اشتراک گذاری

اخبار مرتبط

  • نبرد غول پهپادسازی با دولت آمریکا؛ کار به دادگاه کشانده می‌شود
    نبرد غول پهپادسازی با دولت آمریکا؛ کار به دادگاه کشانده می‌شود 4 ماه پیش
  • ویدیو رسمی سامسونگ از نمایشگر ضد جاسوسی گوشی گلکسی اس ۲۶ اولترا
    ویدیو رسمی سامسونگ از نمایشگر ضد جاسوسی گوشی گلکسی اس ۲۶ اولترا 4 ماه پیش
  • درآمد گیمینگ اپ استور به ۵۲٫۵ میلیارد دلار رسید
    درآمد گیمینگ اپ استور به ۵۲٫۵ میلیارد دلار رسید 4 ماه پیش
  • اوپو گوشی تاشو جدیدی با دوربین ۲۰۰ مگاپیکسلی می‌سازد
    اوپو گوشی تاشو جدیدی با دوربین ۲۰۰ مگاپیکسلی می‌سازد 4 ماه پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • ارتباطات 160
  • امنیت 295
  • اینترنت 3435
  • بازی 8824
  • برنامه نویسی 34
  • تبلیغات 23
  • تکنولوژی 31916
  • دانش‌بنیان 1
  • رمز ارز 1252
  • سیستم عامل 237
  • شبکه اجتماعی 656
  • علم و دانش 14927
  • فناوری 7871
  • کاریکاتور 556
  • کسب و کار 708
  • موبایل 725
  • میزبانی وب 40
  • نرم افزار - سخت افزار 447

جدیدترین مقالات

  • نقش رم در بهبود پاسخ‌گویی دیتابیس‌های سنگین
    نقش رم در بهبود پاسخ‌گویی دیتابیس‌های سنگین 3 روز پیش
  • گزینه‌های توسعه‌دهنده اندروید؛ تنظیمات پنهان برای افزایش سرعت گوشی
    گزینه‌های توسعه‌دهنده اندروید؛ تنظیمات پنهان برای افزایش سرعت گوشی 4 ماه پیش
  • iOS 26.3 منتشر شد؛ ۶ قابلیت جدید برای آیفون
    iOS 26.3 منتشر شد؛ ۶ قابلیت جدید برای آیفون 4 ماه پیش
  • اندروید ۱۷ بتا منتشر شد؛ تمرکز ویژه بر گوشی‌های تاشو
    اندروید ۱۷ بتا منتشر شد؛ تمرکز ویژه بر گوشی‌های تاشو 4 ماه پیش
  • رازهای اندروید؛ قابلیت‌هایی که استفاده از گوشی را ساده‌تر می‌کنند
    رازهای اندروید؛ قابلیت‌هایی که استفاده از گوشی را ساده‌تر می‌کنند 4 ماه پیش

لینکهای پیشنهادی

سرور مجازی | خرید هاست | دانلود نرم افزار | کلاس آنلاین | رپورتاژ خارجی

میزبانی در هاست ویندوز فاماسرور