سایت خبری
famaserver
  • صفحه نخست
  • تکنولوژی
  • علم و دانش
  • بازی
  • فناوری
  • اینترنت
  • موبایل
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

2 ماه پیش
معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

2 ماه پیش
جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

2 ماه پیش
شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

2 ماه پیش
آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

2 ماه پیش
وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

2 ماه پیش
قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

2 ماه پیش
چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

2 ماه پیش
کاهش 20 درصدی واردات تلفن همراه در 5 ماهه امسال

کاهش ۲۰ درصدی واردات تلفن همراه در ۵ ماهه امسال

2 ماه پیش
۵ عادت مخرب که گوشی هوشمند شما را نابود می‌کند

۵ عادت مخرب که گوشی هوشمند شما را نابود می‌کند

2 ماه پیش

هکرها از هوش مصنوعی گوگل علیه خودش استفاده می‌کنند

زمان انتشار: 29 مارس 2025 ساعت 14:35

دسته بندی: تکنولوژی

شناسه خبر: 906449

زمان مطالعه: 6 دقیقه

هکرها از هوش مصنوعی گوگل علیه خودش استفاده می‌کنند

هکرها از هوش مصنوعی گوگل علیه خودش استفاده می‌کنند

می‌گویند برای شکار یک دزد باید مثل دزد فکر کرد. شاید همین موضوع در مورد هک مدل‌های زبانی بزرگ (LLM) هم صدق کند. محققان دانشگاه کالیفرنیا سن دیگو و دانشگاه ویسکانسین راهی پیدا کرده‌اند تا مدل‌های هوش مصنوعی جمینای گوگل را در برابر حملات هکری آسیب‌پذیرتر کنند و جالب اینکه این‌کار را با استفاده از ابزارهای گوگل انجام داده‌اند.

به نوشته‌ی Arstechnica، تکنیک Fun-Tuning میزان موفقیت حملات تزریق پرامپت (Prompt Injection) را به طرز چشمگیری افزایش می‌دهد. در این حملات، دستورهای مخفی در متن جاسازی می‌شوند تا مدل هوش مصنوعی را فریب دهند.

نکته‌ی جالب درمورد روش Fun-Tuning اینکه از ویژگی تنظیم دقیق (Fine-Tuning) مدل جمینای سؤاستفاده می‌کند. این قابلیت معمولاً برای آموزش مدل روی مجموعه داده‌های سفارشی کسب‌وکارها طراحی شده است، اما محققان از آن برای بهینه‌سازی خودکار حملات تزریق پرامپت استفاده کردند. به‌بیان دیگر، محققان به جمینای یاد دادند که چطور خودش را فریب دهد.

محققان دریافتند که افزودن پیشوندها و پسوندهای نامتعارف به پرامپت معمولی، شانس موفقیت آن را به شدت افزایش می‌دهد. به‌عنوان مثال، پرامپتی که به‌تنهایی شکست می‌خورد در صورت اضافه‌شدن عباراتی مانند «wandel ! ! ! !” یا “formatted ! ASAP !» به حمله‌ی موفق تبدیل خواهد شد.

نتایج آزمایش‌ها نشان می‌دهد تأثیر چشمگیر روش Fun-Tuning را روی مدل‌های مختلف جمینای نشان می‌دهد:

  • در مدل Gemini 1.5 Flash میزان موفقیت حمله ۶۵ درصد بود
  • در مدل Gemini 1.0 Pro این میزان به ۸۲ رسید؛ بیش از دو برابر نرخ موفقیت حملات معمولی بدون Fun-Tuning
  • حملات Fun-Tuning بین مدل‌های مختلف قابل انتقال بودند، یعنی تزریق پرامپتی که روی یک نسخه کار می‌کرد، اغلب روی نسخه‌های دیگر هم مؤثر بود

ضعف امنیتی که در روش Fun-Tuning مورد استفاده قرار می‌گیرد از نحوه‌ی کارکرد تنظیم دقیق (Fine-Tuning) ناشی می‌شود. مدل‌های هوش مصنوعی برای ارزیابی میزان خطای خود هنگام آموزش، از سیستمی به نام Loss Score استفاده می‌کنند. هکرها می‌توانند از همین مکانیزم بازخوردی برای بهینه‌سازی حملات خود بهره ببرند و روش موفقی برای فریب سیستم بیابند.

مقالات مرتبط:
  • هکر باهوش ChatGPT را فریب داد و حواشی زیادی به پا کرد

  • اپل: سرورهای هوش مصنوعی ما را هک کنید و یک میلیون دلار جایزه ببرید

گوگل هنوز واکنش مستقیمی به روش جدید Fun-Tuning نشان نداده است، اما سخنگوی این شرکت در بیانیه‌ای اعلام کرد مقابله با این نوع حملات همواره یکی از اولویت‌ها به‌حساب می‌آید و مدل‌های جمینای به‌طور مداوم در برابر حملات تزریق پرامپت و سایر تهدیدها آزمایش می‌شوند.

محققان باور دارند جلوگیری از Fun-Tuning آسان نخواهد بود زیرا بازخوردی که استفاده از این روش را ممکن می‌کند، بخش مهم و اساسی فرایند تنظیم دقیق مدل‌ها است. در نتیجه، مسدودکردن این نوع حمله می‌تواند به قیمت کاهش کارایی کلی Fine-Tuning تمام شود.

حتما بخوانید : هندزفری پشت‌باز SoundCore انکر با ۲۴ ساعت شارژدهی و هوش مصنوعی معرفی شد
اشتراک گذاری

اخبار مرتبط

  • گوشی گلکسی A24 از این قابلیت‌های هوش مصنوعی محروم است
    گوشی گلکسی A24 از این قابلیت‌های هوش مصنوعی محروم است 10 ساعت پیش
  • اتحادیه اروپا «گوگل زیرو» را زیر ذره‌بین می‌برد
    اتحادیه اروپا «گوگل زیرو» را زیر ذره‌بین می‌برد 10 ساعت پیش
  • بهترین ابزارهای هوش مصنوعی کدام‌اند؟ نگاهی به جعبه‌ابزار تیم زومیت
    بهترین ابزارهای هوش مصنوعی کدام‌اند؟ نگاهی به جعبه‌ابزار تیم زومیت 10 ساعت پیش
  • مدیرعامل پیندو به ۷۴ ضربه شلاق محکوم شد/ مجوز این پلتفرم ابطال می‌شود
    مدیرعامل پیندو به ۷۴ ضربه شلاق محکوم شد/ مجوز این پلتفرم ابطال می‌شود 10 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • ارتباطات 160
  • امنیت 293
  • اینترنت 3435
  • بازی 8814
  • برنامه نویسی 34
  • تبلیغات 21
  • تکنولوژی 29790
  • دانش‌بنیان 1
  • رمز ارز 1252
  • سیستم عامل 205
  • شبکه اجتماعی 627
  • علم و دانش 14927
  • فناوری 7462
  • کاریکاتور 556
  • کسب و کار 677
  • موبایل 724
  • میزبانی وب 40
  • نرم افزار - سخت افزار 416

جدیدترین مقالات

  • هر آنچه یک نویسنده تازه کار باید درباره چاپ اولین کتاب بداند
    هر آنچه یک نویسنده تازه کار باید درباره چاپ اولین کتاب بداند 11 ساعت پیش
  • مزایای استفاده از استابلایزر در محل کار و خانه هوشمند
    مزایای استفاده از استابلایزر در محل کار و خانه هوشمند 11 ساعت پیش
  • بهترین شرکت های نقد کننده درامد یوتیوب کدامند؟ (+8 شرکت های واسطه یوتیوب)
    بهترین شرکت های نقد کننده درامد یوتیوب کدامند؟ (+8 شرکت های واسطه یوتیوب) 11 ساعت پیش
  • هر ماه حدود ۲۰ درصد از رانندگان تاکسی اینترنتی ریزش دارند
    هر ماه حدود ۲۰ درصد از رانندگان تاکسی اینترنتی ریزش دارند 11 ساعت پیش
  • بهترین لپ تاپ تا ۴۰ میلیون کدام است؟
    بهترین لپ تاپ تا ۴۰ میلیون کدام است؟ 11 ساعت پیش

لینکهای پیشنهادی

سرور مجازی | خرید هاست | دانلود نرم افزار | کلاس آنلاین | رپورتاژ خارجی

میزبانی در هاست ویندوز فاماسرور