سایت خبری
famaserver
  • صفحه نخست
  • تکنولوژی
  • علم و دانش
  • بازی
  • فناوری
  • اینترنت
  • موبایل
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

2 ماه پیش
معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

2 ماه پیش
جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

2 ماه پیش
شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

2 ماه پیش
آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

2 ماه پیش
وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

2 ماه پیش
قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

2 ماه پیش
چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

2 ماه پیش
کاهش 20 درصدی واردات تلفن همراه در 5 ماهه امسال

کاهش ۲۰ درصدی واردات تلفن همراه در ۵ ماهه امسال

2 ماه پیش
۵ عادت مخرب که گوشی هوشمند شما را نابود می‌کند

۵ عادت مخرب که گوشی هوشمند شما را نابود می‌کند

2 ماه پیش

هوش مصنوعی جدید اپل می‌تواند تصاویر را ببیند، بسازد و ویرایش کند

زمان انتشار: 20 دسامبر 2025 ساعت 15:12

دسته بندی: تکنولوژی

شناسه خبر: 973338

زمان مطالعه: 7 دقیقه

هوش مصنوعی جدید اپل می‌تواند تصاویر را ببیند، بسازد و ویرایش کند

هوش مصنوعی جدید اپل می‌تواند تصاویر را ببیند، بسازد و ویرایش کند

تیمی از پژوهشگران اپل با تکیه بر مدل هوش مصنوعی قبلی خود به نام UniGen از UniGen 1.5 رونمایی کرده‌اند؛ سیستمی که می‌تواند در قالب یک مدل واحد، تصاویر را درک کند، بسازد و ویرایش کند.

کپی لینک

ادامه مسیر UniGen

پژوهشگران اپل قبلاً مقاله‌ای منتشر کردند که در آن یک مدل زبانی بزرگ چندوجهی معرفی شد. مدل مذکور می‌توانست بدون نیاز به مدل‌های جداگانه، توانایی درک و تولید تصویر را در سیستم یکپارچه ارائه دهد.

اکنون اپل در مقاله‌ی جدیدی با عنوان UniGen-1.5: Enhancing Image Generation and Editing through Reward Unification in Reinforcement Learning، نسخه‌ی تکامل‌یافته‌ی این مدل را معرفی کرده است.

کپی لینک

UniGen 1.5 چگونه کار می‌کند؟

مدل UniGen 1.5 علاوه‌بر درک و تولید تصویر، قابلیت ویرایش تصویر را نیز به همان چارچوب یکپارچه اضافه می‌کند. این رویکرد برخلاف بسیاری از سیستم‌های فعلی است که هرکدام از این وظایف را به مدل‌های جداگانه می‌سپارند.

یکپارچه‌سازی قابلیت‌ها کار ساده‌ای نیست، زیرا درک تصویر و تولید آن به رویکردهای متفاوتی نیاز دارند. بااین حال، پژوهشگران اپل معتقدند مدلی که تصویر را بهتر «می‌فهمد»، می‌تواند در تولید و ویرایش آن نیز عملکرد دقیق‌تری داشته باشد.

کپی لینک

چالش ویرایش تصویر و راه‌حل اپل

به گفته‌ی محققان اپل، یکی از بزرگ‌ترین مشکلات مدل‌های ویرایش تصویر، ناتوانی در درک کامل دستورهای پیچیده و جزئی است؛ به‌ویژه زمانی که تغییرات بسیار ظریف یا کاملاً هدفمند باشند.

برای حل این مشکل، UniGen 1.5 از مرحله‌ای جدید پس از آموزش نظارت‌شده (Post-SFT) به نام Edit Instruction Alignment استفاده می‌کند. در این مرحله، مدل ابتدا تصویر اولیه و دستور ویرایش را دریافت و سپس تلاش می‌کند توصیف متنی دقیقی از تصویر نهایی تولید کند؛ توصیفی که محتوای معنایی تصویر ویرایش‌شده را مشخص می‌کند.

این گام میانی کمک می‌کند مدل پیش از ساخت تصویر نهایی، درک عمیق‌تری از نتیجه‌ی مورد انتظار داشته باشد و ویرایش را دقیق‌تر انجام دهد.

کپی لینک

یادگیری تقویتی با پاداش یکسان

پژوهشگران با یک نوآوری مهم در UniGen 1.5 از یادگیری تقویتی استفاده کرده‌اند؛ سیستم پاداش یکسان برای تولید و ویرایش تصویر. این موضوع پیش‌تر چالش‌برانگیز بود، زیرا ویرایش تصویر می‌تواند از تغییرات جزئی تا دگرگونی کامل تصویر را شامل شود.

مقاله‌های مرتبط:
  • چطور قابلیت‌های هوش مصنوعی اپل را در آیفون و مک فعال کنیم؟

  • نصب هوش مصنوعی روی آیفون‌های قدیمی؛ محدودیت‌ها را دور بزنید! [تماشا کنید]

نتایج آزمایش‌ها نشان می‌دهد UniGen 1.5 در بنچمارک‌های معتبر صنعت که میزان پایبندی به دستور، کیفیت بصری و توانایی ویرایش‌های پیچیده را می‌سنجند، عملکردی هم‌سطح یا بهتر از بسیاری از مدل‌های پیشرفته‌ی متن‌باز و اختصاصی داشته است. این مدل در آزمون‌های GenEval و DPG-Bench امتیازهای ۰٫۸۹ و ۸۶٫۸۳ را ثبت کرد و در بخش ویرایش تصویر نیز امتیاز کلی ۴٫۳۱ را به‌دست آورد؛ عددی که آن را بالاتر از مدل‌هایی مانند OminiGen2 و در سطح مدل‌های اختصاصی قرار می‌دهد.

کپی لینک

محدودیت‌ها

با وجود پیشرفت‌های UniGen 1.5، این مدل همچنان در تولید دقیق متن داخل تصاویر و حفظ ثبات هویت در برخی سناریوها با مشکل مواجه است. برای مثال، گاهی شکل یا بافت چهره‌ی یک حیوان یا رنگ پرهای پرنده در ویرایش‌های متوالی تغییر می‌کند. پژوهشگران تأکید می‌کنند که رفع این محدودیت‌ها به بهبودهای بیشتری در نسخه‌های آینده نیاز دارد.

حتما بخوانید : گزینه «دیسلایک» در ویدیوهای کوتاه یوتیوب تغییر می‌کند
اشتراک گذاری

اخبار مرتبط

  • آیا این مدل دستی کنسول PS6 است؟
    آیا این مدل دستی کنسول PS6 است؟ 7 ساعت پیش
  • تماشا کنید: اولین تریلر Digger، فیلم جدید تام کروز
    تماشا کنید: اولین تریلر Digger، فیلم جدید تام کروز 7 ساعت پیش
  • اضطراب دفع مدفوع: وقتی رفتن به دستشویی در خارج از خانه استرس‌زا می‌شود
    اضطراب دفع مدفوع: وقتی رفتن به دستشویی در خارج از خانه استرس‌زا می‌شود 7 ساعت پیش
  • چت‌بات‌ها ازاین‌پس سن شما را حدس می‌زنند: عصر جدید نظارت بر هوش مصنوعی
    چت‌بات‌ها ازاین‌پس سن شما را حدس می‌زنند: عصر جدید نظارت بر هوش مصنوعی 7 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • ارتباطات 160
  • امنیت 293
  • اینترنت 3435
  • بازی 8814
  • برنامه نویسی 34
  • تبلیغات 21
  • تکنولوژی 30231
  • دانش‌بنیان 1
  • رمز ارز 1252
  • سیستم عامل 213
  • شبکه اجتماعی 636
  • علم و دانش 14927
  • فناوری 7541
  • کاریکاتور 556
  • کسب و کار 688
  • موبایل 724
  • میزبانی وب 40
  • نرم افزار - سخت افزار 424

جدیدترین مقالات

  • آیا این مدل دستی کنسول PS6 است؟
    آیا این مدل دستی کنسول PS6 است؟ 10 ساعت پیش
  • تماشا کنید: اولین تریلر Digger، فیلم جدید تام کروز
    تماشا کنید: اولین تریلر Digger، فیلم جدید تام کروز 10 ساعت پیش
  • اضطراب دفع مدفوع: وقتی رفتن به دستشویی در خارج از خانه استرس‌زا می‌شود
    اضطراب دفع مدفوع: وقتی رفتن به دستشویی در خارج از خانه استرس‌زا می‌شود 10 ساعت پیش
  • چت‌بات‌ها ازاین‌پس سن شما را حدس می‌زنند: عصر جدید نظارت بر هوش مصنوعی
    چت‌بات‌ها ازاین‌پس سن شما را حدس می‌زنند: عصر جدید نظارت بر هوش مصنوعی 10 ساعت پیش
  • مشخصات گوشی دریمی لو رفت؛ محصولی از یک جاروبرقی‌ساز!
    مشخصات گوشی دریمی لو رفت؛ محصولی از یک جاروبرقی‌ساز! 10 ساعت پیش

لینکهای پیشنهادی

سرور مجازی | خرید هاست | دانلود نرم افزار | کلاس آنلاین | رپورتاژ خارجی

میزبانی در هاست ویندوز فاماسرور