سایت خبری
famaserver
  • صفحه نخست
  • تکنولوژی
  • علم و دانش
  • بازی
  • فناوری
  • اینترنت
  • موبایل
سایت خبری
برترین عناوین خبری
  • خرید بیمه: سنتی یا آنلاین؟ کدامیک تجربه بهتری برای مشتریان ایجاد می‌کند؟

سرتیتر خبرها

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

با آیفون ۱۷ دیگر عکس‌های سلفی خراب نمی‌شود!

2 ماه پیش
معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

معیوب‌ترین گوشی‌های هوشمند جهان؛ آیفون و سامسونگ در میانه جدول خرابی

2 ماه پیش
جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

جنجال خط و خش‌های آیفون ۱۷؛ اپل علت واقعی را توضیح داد

2 ماه پیش
شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

شارژ ۸۰ درصدی باتری: افسانه یا واقعیت؟ (تحلیل علمی)

2 ماه پیش
آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

آموزش: دلیل کند شدن و ری‌استارت مداوم گوشی‌های اندرویدی چیست؟

2 ماه پیش
وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

وان‌پلاس ۱۵: تاریخ عرضه جهانی و مشخصات فنی فاش شد

2 ماه پیش
قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

قیمت مقرون به صرفه آیفون ۱۷ در آمریکا

2 ماه پیش
چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

چرا باید حالت هواپیما را در گوشی فعال کنیم؟ مزایا و کاربردهای شگفت‌انگیز

2 ماه پیش
کاهش 20 درصدی واردات تلفن همراه در 5 ماهه امسال

کاهش ۲۰ درصدی واردات تلفن همراه در ۵ ماهه امسال

2 ماه پیش
۵ عادت مخرب که گوشی هوشمند شما را نابود می‌کند

۵ عادت مخرب که گوشی هوشمند شما را نابود می‌کند

2 ماه پیش

ابزار شبیه سازی صوتی OpenAI که کاربران هنوز نمی‌توانند از آن استفاده کنند!

زمان انتشار: 8 آوریل 2024 ساعت 11:53

دسته بندی: فناوری

شناسه خبر: 806063

زمان مطالعه: 10 دقیقه

ابزار شبیه سازی صوتی OpenAI که کاربران هنوز نمی‌توانند از آن استفاده کنند!

ابزار شبیه سازی صوتی OpenAI که کاربران هنوز نمی‌توانند از آن استفاده کنند!

شبیه‌ساز صدای  اوپن ای‌آی یک توسعه API متن به گفتار است. این موتور صوتی به کاربران اجازه می‌دهد تا هر نمونه صدای 15 ثانیه‌ای را برای تولید یک کپی مصنوعی از آن صدا آپلود کنند. هنوز تاریخ مشخصی برای عرضه عمومی این فناوری وجود ندارد.

آموزش مدل و سنتز صدا
مدل هوش مصنوعی مولدی است که Voice Engine بر روی ترکیبی از داده‌های دارای مجوز و در دسترس عموم آموزش داده شده است. این شبیه‌ساز صدا (Voice Engine) دارای زیربنای قابلیت‌های صدا و خواندن با صدای بلند در ChatGPT، ربات چت مبتنی بر هوش مصنوعی  اوپن ای‌آی، و همچنین صداهای از پیش تعیین شده موجود در API متن به گفتار اوپن ای‌آی  است. 

 Voice Engine روی داده‌های کاربر آموزش یا تنظیم دقیقی ندارد که تا حدی به دلیل روشی زودگذر است که در این مدل گفتار را تولید می‌کند.

جف هریس، عضو بخش تولید اوپن‌ای‌آی گفت: «ما یک نمونه از فایل صوتی و متن کوچک را به گفتار واقعی را تولید می‌کنیم که با سخنران اصلی مطابقت دارد. صوتی که استفاده می‌شود پس از تکمیل درخواست حذف می‌شود.» این فناوری جدید نیست. تعدادی از استارت‌آپ‌ها سال‌ها محصولات شبیه‌سازی صدا را ارائه کرده‌اند، از ElevenLabs گرفته تا Replica Studios، Papercup، Deepdub و Respeecher و همینطور شرکت‌های بزرگ فناوری مانند آمازون، گوگل و مایکروسافت – که اتفاقاً آخرین آن‌ها سرمایه گذار بزرگ اوپن ای‌آی است.

هریس ادعا کرد که رویکرد اوپن ای‌آی، طور کلی سخنرانی با کیفیت بالاتری را ارائه می‌دهد.

Voice Engine کنترل‌هایی را برای تنظیم لحن، زیر و بم یا آهنگ صدا ارائه نمی‌کند. در واقع، در حال حاضر هیچ دکمه یا صفحه تنظیم دقیقی ارائه نمی‌دهد، اگرچه هریس خاطرنشان می‌کند که انواع طرز بیان در نمونه صدای 15 ثانیه‌ای در مکالمات بعدی نیز ادامه خواهد داشت (به عنوان مثال، اگر با لحنی هیجان زده صحبت کنید، صدای مصنوعی به طور مداوم هیجان زده به نظر می‌رسد).

 

ابزار شبیه سازی صوتی OpenAI که کاربران هنوز نمی‌توانند از آن استفاده کنند!

صدا به عنوان کالا
دستمزد صداپیشگان از 12 تا 79 دلار در ساعت متغیر است – که بسیار گران‌تر از Voice Engine است. در صورت تحقق، ابزار اوپن ای‌آی می‌تواند کار صوتی را «کالایی» کند. در این صورت آیا می‌توان اینگونه نتیجه گرفت که این کار، صداپیشگان را بیکار می‌کند؟

باید گفت که برعکس، استعدادها به حاشیه رانده نمی‌شوند. مدتی است که با وجود تهدیدات هوش مصنوعی مولد، از صداپیشگان خواسته می‌شود تا حقوق صدای خود را امضا کنند تا مشتریان بتوانند از هوش مصنوعی برای تولید نسخه‌های مصنوعی استفاده کنند که در نهایت می‌تواند جایگزین آنها شود. 

استودیوی Replica سال گذشته قراردادی تا حدی بحث برانگیز، با SAG-AFTRA امضا کرد تا نسخه‌هایی از صدای اعضای اتحادیه هنرمندان رسانه ایجاد و مجوز ایجاد کند. این سازمان‌ها گفتند که این ترتیب، شرایط و ضوابط منصفانه و اخلاقی را برای اطمینان از رضایت اجراکننده در مورد شرایط استفاده از صداهای مصنوعی در آثار جدید، از جمله بازی‌های ویدیویی، ایجاد کرده است.

هریس گفت: «من فکر می‌کنم که فرصت‌های زیادی وجود خواهد داشت که به‌عنوان یک صداپیشه از طریق این نوع فناوری، میزان دسترسی خود را افزایش دهید.»

اخلاق و دیپ فیک
برنامه‌های شبیه سازی صدا می‌توانند مورد سوء استفاده قرار گیرند. این نگرانی وجود دارد که خرابکارها تلاش کنند تا با شبیه‌سازی صدا بر انتخابات تأثیر بگذارند. در ماه ژانویه، یک کمپین تلفنی از صدای جعلی رئیس جمهور بایدن استفاده کرد تا شهروندان نیوهمپشایر را از رای دادن منصرف کند که باعث شد مقامات برای غیرقانونی کردن چنین کمپین‌هایی اقدام کنند.

 

ابزار شبیه سازی صوتی OpenAI که کاربران هنوز نمی‌توانند از آن استفاده کنند!

سوالی که مطرح می‌شود این است که جدای از ممنوعیت دیپ فیک در حوزه سیاست، اوپن ای‌آی  چه اقدامات دیگری را انجام می‌دهد؟
هریس به چند مورد اشاره کرد. اولاً، Voice Engine برای شروع فقط در دسترس گروه بسیار کوچکی از توسعه دهندگان (حدود 10 نفر) قرار گرفت و موارد استفاده‌ای که کم خطر و از نظر اجتماعی سودمند هستند مانند سلامت و بهداشت اولویت‌بندی می‌شوند.
دوم، کلون‌های ایجاد شده با Voice Engine  واترمارک می شوند که مقاوم در برابر دستکاری هستند. سوم، اوپن ای‌آی قصد دارد به اعضای شبکه تیم قرمز خود که گروهی از کارشناسان هستند که به ارزیابی ریسک مدل هوش مصنوعی شرکت و استراتژی‌های کاهش آن کمک می‌کنند، دسترسی به Voice Engine برای جلوگیری از استفاده‌های مخرب ارائه دهد.

انتشار عمومی
بسته به نحوه پیش‌نمایش و استقبال عمومی از Voice Engine، اوپن ای‌آی  ممکن است این ابزار را در پایگاه توسعه‌دهندگان گسترده‌تر خود عرضه کند، اما در حال حاضر، این شرکت تمایلی به توضیحات بیشتری ندارد.

هریس فاش کرد که اوپن ای‌آی در حال آزمایش یک مکانیسم امنیتی است که کاربران را وادار می‌کند متن‌های تولید شده را به‌طور تصادفی بخوانند تا دلیلی بر این باشد که از نحوه استفاده از صدای خود آگاه هستند. هریس گفت که این، می‌تواند به اوپن ای‌آی اعتماد به نفس لازم برای ارائه Voice Engine به افراد بیشتری بدهد.

او گفت: «آنچه ما را از نظر فناوری تطبیق صدای واقعی به جلو می‌برد، حفره‌های ایمنی کشف شده و اقدامات محافظتی است که در اختیار داریم بستگی دارد. ما نمی‌خواهیم کاربران میان صداهای مصنوعی و صدای واقعی انسانی اشتباه کنند.»

حتما بخوانید : جدیدترین قیمت رمزارزها در جهان: ۲۰ فروردين

مجله خبری بیکینگ

برچسب ها
Voice Engine
اشتراک گذاری

اخبار مرتبط

  • انگشت حلقه و گوشی‌های هوشمند؛ عارضه‌ای پنهان که در حال فراگیر شدن است
    انگشت حلقه و گوشی‌های هوشمند؛ عارضه‌ای پنهان که در حال فراگیر شدن است 23 ساعت پیش
  • فسیل شدن مغز واقعیت دارد؟ هشدار پژوهشگران درباره خطرات ویدئوهای کوتاه
    فسیل شدن مغز واقعیت دارد؟ هشدار پژوهشگران درباره خطرات ویدئوهای کوتاه 23 ساعت پیش
  • نقطه عطف ۷۵ سالگی: وقتی تاب‌آوری بدن در پیری به پایان می‌رسد
    نقطه عطف ۷۵ سالگی: وقتی تاب‌آوری بدن در پیری به پایان می‌رسد 23 ساعت پیش
  • چرا Crater می‌تواند آینده خودروهای برقی آفرودی را تغییر دهد
    چرا Crater می‌تواند آینده خودروهای برقی آفرودی را تغییر دهد 23 ساعت پیش

دیدگاه ها

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دسته بندی موضوعات

  • ارتباطات 160
  • امنیت 293
  • اینترنت 3435
  • بازی 8814
  • برنامه نویسی 34
  • تبلیغات 21
  • تکنولوژی 29591
  • دانش‌بنیان 1
  • رمز ارز 1252
  • سیستم عامل 203
  • شبکه اجتماعی 622
  • علم و دانش 14927
  • فناوری 7413
  • کاریکاتور 556
  • کسب و کار 670
  • موبایل 724
  • میزبانی وب 40
  • نرم افزار - سخت افزار 413

جدیدترین مقالات

  • قطعی کلادفلر بخش بزرگی از اینترنت را فلج کرد
    قطعی کلادفلر بخش بزرگی از اینترنت را فلج کرد 4 ساعت پیش
  • در جستجوی MH370: ناوگان رباتیک برای یافتن هواپیمای گمشده مالزی به اقیانوس بازمی‌گردد
    در جستجوی MH370: ناوگان رباتیک برای یافتن هواپیمای گمشده مالزی به اقیانوس بازمی‌گردد 4 ساعت پیش
  • کتاب‌خوان رنگی جدید آمازون تا یک هفته دیگر عرضه می‌شود
    کتاب‌خوان رنگی جدید آمازون تا یک هفته دیگر عرضه می‌شود 4 ساعت پیش
  • بنچمارک تراشه 9850X3D لو رفت؛ محصول هیجان‌انگیز ای‌ام‌دی برای گیمرها
    بنچمارک تراشه 9850X3D لو رفت؛ محصول هیجان‌انگیز ای‌ام‌دی برای گیمرها 4 ساعت پیش
  • پس از ۳۰ سال، Run ویندوز سرانجام بازطراحی شد
    پس از ۳۰ سال، Run ویندوز سرانجام بازطراحی شد 4 ساعت پیش

لینکهای پیشنهادی

سرور مجازی | خرید هاست | دانلود نرم افزار | کلاس آنلاین | رپورتاژ خارجی

میزبانی در هاست ویندوز فاماسرور