دانش و فناوری

تقلید صدا با هوش مصنوعی

نکات برگزیده مطلب
  • در برخی موارد، این برنامه‌ها فقط به یک کلیپ بین ۱۵ تا ۳۰ ثانیه‌ای نیاز دارند تا تقلیدهای متقاعدکننده ایجاد کنند.
  • به احتمال زیاد طولی نمی‌کشد که این تاکتیک‌ها رایج می‌شوند و متأسفانه تشخیص واقعیت از تخیل دشوارتر می‌شود. بنابراین متأسفانه هیچ مانعی برای جلوگیری از افزایش سریع تقلید بصری و صوتی مبتنی بر هوش مصنوعی وجود ندارد.

توجه فزاینده‌ای که در سال‌های اخیر به فناوری (دیپ‌فیک AI) معطوف شده، عمدتاً بر فریب‌های بصری متمرکز شده است. ویدیوهایی را در نظر بگیرید که بر اساس پیشنهادات کاربران و مشکلات دردسرساز پیرامون همه این توانایی‌ها می‌توانند به‌طور غیرمعمول چهره یک فرد را بر روی بدن یک فرد سورئال دیگری قرار دهند. فیلترهای صوتی اگرچه لزوماً جدید نیستند، اما اخیراً به لطف و کمک هوش مصنوعی جدی‌تر گرفته شده‌اند. متأسفانه این کار پیامدهای اجتماعی خود را به همراه دارد و مانند صنعت دیپ فیک ویدیو به نظر می‌رسد که تنظیم‌کننده‌های کمی می‌توانند برای جلوگیری از آن کار انجام دهند.

ابزارهای نوظهور هوش مصنوعی مانند (Koe Recast) و (Voice.ai) به سرعت توانایی خود را برای تبدیل ورودی‌های صوتی به صدایی که هر کسی می‌خواهد، اگر منبع کافی برای تجزیه و تحلیل ارائه شود، تقویت می‌کند. در برخی موارد، این برنامه‌ها فقط به یک کلیپ بین ۱۵ تا ۳۰ ثانیه‌ای نیاز دارند تا تقلیدهای متقاعدکننده ایجاد کنند. اگرچه (Koe Recast) در مرحله آزمایش خصوصی خود است، اما نمونه‌هایی از قبل موجود است که دومین کلیپ کوتاه از مارک زاکربرگ را به تصویر می‌کشد که شبیه یک راوی باس سنگین، یک زن و حتی یک شخصیت انیمه با صدای بلند است.

هدف این است که به مردم کمک کنیم به هر طریقی که می‌توانند، شادی خود را ابراز کنند. آن‌ها قصد دارند در نهایت یک اپلیکیشن دسکتاپ منتشر کنند که بتواند صدای کاربران را در زمان واقعی در پلتفرم‌هایی مانند (Discord و Zoom) تغییر دهد. این فناوری نیز مانند هر فناوری دیگری ممکن است حاوی هم نکات مثبت و هم منفی باشد، اما برای اکثریت قریب به اتفاق مردم شگفت‌انگیز است و مردم  از این امر بسیار سود خواهند برد. با این حال منتقدان همچنان نسبت به اعتماد عمومی به چنین ابزارهای بالقوه‌ای شک دارند. اخیراً برخی از نمایندگی‌های مرکز تماس برون مرزی نیز شروع به استفاده از نرم‌افزار هوش مصنوعی برای پاک کردن لهجه‌های کشورهای بومی خود کرده‌اند تا تعصبات مصرف‌کنندگان غربی را کاهش دهند و آمریکایی‌تر به نظر برسند. در حالی که سازندگان این ابزار استدلال می‌کنند اختراع آن‌ها از تعصب جلوگیری می‌کند. بسیاری مخالفت کرده‌اند که این ابزار صرفاً وسیله‌ای برای اجتناب از پرداختن به مسائل بزرگ‌تر است یعنی بیگانه‌هراسی و نژادپرستی.

به همین ترتیب، کارمندان برخی از کسب‌وکارهای بزرگ‌تر نیز طعمه کلاهبردارانی شده‌اند که درخواست انتقال وجه و رمز عبور می‌کنند، در حالی که از تقلید صدا استفاده می‌کنند. کایل آلسپاچ گزارشگر امنیت سایبری پروتکل، اخیراً در هنگام سخنرانی در بازار (NPR) توضیح داد: کسب‌وکارهای بزرگ واقعاً اهداف رسیده‌ای برای این چیزها هستند. وی همچنین خاطرنشان کرد که این نوع کلاهبرداری‌ها هنوز در مراحل ابتدایی خود هستند اما به احتمال زیاد طولی نمی‌کشد که این تاکتیک‌ها رایج می‌شوند و متأسفانه تشخیص واقعیت از تخیل دشوارتر می‌شود. بنابراین متأسفانه هیچ مانعی برای جلوگیری از افزایش سریع تقلید بصری و صوتی مبتنی بر هوش مصنوعی وجود ندارد.

منبع
ثریا

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

دکمه بازگشت به بالا