سایت خبری
famaserver
  • صفحه نخست
  • تکنولوژی
  • علم و دانش
  • بازی
  • فناوری
  • اینترنت
  • موبایل
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

معرفی گیفت کارت آیتونز؛ کلید طلایی ورود به دنیای اپل

معرفی گیفت کارت آیتونز؛ کلید طلایی ورود به دنیای اپل

6 ماه پیش
با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

8 ماه پیش
معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

8 ماه پیش
جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

8 ماه پیش
شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

8 ماه پیش
آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

8 ماه پیش
وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

8 ماه پیش
قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

8 ماه پیش
چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

8 ماه پیش
کاهش 20 درصدی واردات تلفن همراه در 5 ماهه امسال

کاهش ۲۰ درصدی واردات تلفن همراه در ۵ ماهه امسال

8 ماه پیش

هوش مصنوعی جدید گوگل با توانایی ساخت متن، تصویر و صدا معرفی شد

زمان انتشار: 12 دسامبر 2024 ساعت 6:32

دسته بندی: تکنولوژی

شناسه خبر: 869033

زمان مطالعه: 7 دقیقه

هوش مصنوعی جدید گوگل با توانایی ساخت متن، تصویر و صدا معرفی شد

هوش مصنوعی جدید گوگل با توانایی ساخت متن، تصویر و صدا معرفی شد

گوگل هوش مصنوعی Gemini 2.0 Flash را رسماً معرفی کرد تا OpenAI رقیب قدرتمندی پیش‌ روی خود داشته باشد.گوگل می‌گوید که Gemini 2.0 Flash افزون‌بر متن، می‌تواند به‌صورت بومی تصویر و صدا تولید و از اپلیکیشن‌ها و خدمات متفرقه استفاده کند. بدین‌ترتیب مدل جدید جمنای می‌تواند به جست‌وجوی گوگل دسترسی داشته باشد و کد اجرا کند و کارهایی انجام دهد که تا پیش‌‌از این، ممکن نبود.به‌نوشته‌ی تک‌کرانچ، نسخه‌ی آزمایشی 2.0 Flash از امروز از‌طریق API Gemini و پلتفرم‌های توسعه‌دهنده‌ی هوش مصنوعی گوگل و AI Studio و Vertex AI در دسترس خواهد بود. با‌این‌حال، قابلیت‌های تولید صدا و تصویر تنها برای «شرکای اولیه» پیش‌از انتشار گسترده در ژانویه (دی و بهمن) در دسترس قرار می‌گیرد.گوگل می‌گوید که در ماه‌های آینده، 2.0 Flash را برای طیف وسیعی از محصولات مانند Android Studio و Chrome DevTools و Firebase و Gemini Code Assist و سایر محصولات منتشر خواهد کرد.نسل اول هوش مصنوعی جمنای Flash، یعنی 1.5 Flash، فقط می‌توانست متن تولید کند و برای کارهای پیچیده‌تر طراحی نشده بود. گوگل می‌گوید که مدل جدیدش «همه‌کاره‌تر» است؛ زیرا می‌تواند ابزارهایی مانند جست‌وجو را فراخوانی کند و با API‌‌های خارجی تعامل داشته باشد.تولسی دوشی، رئیس محصول مدل جمنای در گوگل می‌گوید: «می‌دانیم که Flash به‌دلیل تعادل بین سرعت و عملکرد، در بین توسعه‌دهندگان بسیار محبوبیت دارد؛ اما اکنون قدرتمندتر شده است.»گوگل ادعا می‌کند 2.0 Flash که طبق آزمایش‌های خود گوگل دو برابر سریع‌تر از مدل Gemini 1.5 Pro است، در زمینه‌هایی مانند کدنویسی و تجزیه‌و‌تحلیل تصویر بهبود چشمگیری یافته است. در واقع، به‌ادعای گوگل 2.0 Flash به‌دلیل مهارت‌های ریاضی برتر و «واقع‌گرایی» خود، جایگزین 1.5 Pro به‌عنوان مدل اصلی جمنای می‌شود.تولید صدا یکی دیگر از ویژگی‌های اصلی 2.0 Flash است و دوشی آن را «قابل هدایت و سفارشی‌سازی» توصیف می‌کند. به‌عنوان مثال، این مدل می‌تواند متن را با استفاده از یکی از هشت صدای «بهینه‌شده» برای لهجه‌ها و زبان‌های مختلف روایت کند. دوشی می‌گوید: «می‌توانید از آن بخواهید که کُندتر یا سریع‌تر صحبت کند یا حتی می‌توانید از آن بخواهید که با لحنی شبیه یک دزد دریایی صحبت کند.»گوگل نمونه‌‌های تصویر یا صدا از 2.0 Flash ارائه نکرده است و فعلاً راهی برای دانستن کیفیت آن در مقایسه با خروجی‌های مدل‌های دیگر وجود ندارد.گوگل می‌گوید از فناوری SynthID برای واترمارک‌کردن تمام صدا و تصاویری که با 2.0 Flash تولید می‌شوند، استفاده می‌کند. در نرم‌افزارها و پلتفرم‌هایی که از SynthID پشتیبانی می‌کنند، خروجی‌های مدل علامت‌گذاری خواهند شد.مقاله‌های مرتبطاپل اینتلیجنس در برابر گوگل جمنای؛ کدام‌یک هوش برتر است؟جمینای در اندروید ۱۶ کنترل همه‌چیز را به‌دست می‌گیرد؛ از تنظیم آلارم تا ویدیونسخه‌ی نهایی 2.0 Flash دی و بهمن امسال منتشر خواهد شد. در همین‌ حال، گوگل در حال انتشار API Multimodal Live API است تا به توسعه‌دهندگان در ساخت اپلیکیشن‌هایی با قابلیت پخش زنده‌ی صدا و ویدئو به‌صورت لحظه‌ای کمک کند.گوگل می‌گوید که توسعه‌دهندگان می‌توانند با استفاده از API Multimodal Live، اپلیکیشن‌هایی چندوجهی به‌صورت لحظه‌ای با ورودی‌های صوتی و تصویری از دوربین‌ها یا صفحه‌نمایش ایجاد کنند. این API از ادغام ابزارها برای انجام کارها پشتیبانی می‌کند و می‌تواند «الگوهای گفت‌وگوی طبیعی» مانند وقفه‌ها را مدیریت کند؛ مشابه API Realtime OpenAI.

حتما بخوانید : هشدار سازمان ملل: سه‌چهارم از سطح زمین در معرض خشکی شدید قرار دارد
اشتراک گذاری

اخبار مرتبط

  • نبرد غول پهپادسازی با دولت آمریکا؛ کار به دادگاه کشانده می‌شود
    نبرد غول پهپادسازی با دولت آمریکا؛ کار به دادگاه کشانده می‌شود 4 ماه پیش
  • ویدیو رسمی سامسونگ از نمایشگر ضد جاسوسی گوشی گلکسی اس ۲۶ اولترا
    ویدیو رسمی سامسونگ از نمایشگر ضد جاسوسی گوشی گلکسی اس ۲۶ اولترا 4 ماه پیش
  • درآمد گیمینگ اپ استور به ۵۲٫۵ میلیارد دلار رسید
    درآمد گیمینگ اپ استور به ۵۲٫۵ میلیارد دلار رسید 4 ماه پیش
  • اوپو گوشی تاشو جدیدی با دوربین ۲۰۰ مگاپیکسلی می‌سازد
    اوپو گوشی تاشو جدیدی با دوربین ۲۰۰ مگاپیکسلی می‌سازد 4 ماه پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • ارتباطات 160
  • امنیت 295
  • اینترنت 3435
  • بازی 8824
  • برنامه نویسی 34
  • تبلیغات 23
  • تکنولوژی 31916
  • دانش‌بنیان 1
  • رمز ارز 1252
  • سیستم عامل 237
  • شبکه اجتماعی 656
  • علم و دانش 14927
  • فناوری 7871
  • کاریکاتور 556
  • کسب و کار 708
  • موبایل 725
  • میزبانی وب 40
  • نرم افزار - سخت افزار 447

جدیدترین مقالات

  • نقش رم در بهبود پاسخ‌گویی دیتابیس‌های سنگین
    نقش رم در بهبود پاسخ‌گویی دیتابیس‌های سنگین 3 روز پیش
  • گزینه‌های توسعه‌دهنده اندروید؛ تنظیمات پنهان برای افزایش سرعت گوشی
    گزینه‌های توسعه‌دهنده اندروید؛ تنظیمات پنهان برای افزایش سرعت گوشی 4 ماه پیش
  • iOS 26.3 منتشر شد؛ ۶ قابلیت جدید برای آیفون
    iOS 26.3 منتشر شد؛ ۶ قابلیت جدید برای آیفون 4 ماه پیش
  • اندروید ۱۷ بتا منتشر شد؛ تمرکز ویژه بر گوشی‌های تاشو
    اندروید ۱۷ بتا منتشر شد؛ تمرکز ویژه بر گوشی‌های تاشو 4 ماه پیش
  • رازهای اندروید؛ قابلیت‌هایی که استفاده از گوشی را ساده‌تر می‌کنند
    رازهای اندروید؛ قابلیت‌هایی که استفاده از گوشی را ساده‌تر می‌کنند 4 ماه پیش

لینکهای پیشنهادی

سرور مجازی | خرید هاست | دانلود نرم افزار | کلاس آنلاین | رپورتاژ خارجی

میزبانی در هاست ویندوز فاماسرور