شرکت OpenAI امروز اعلام کرد که عرضه حالت صوتی پیشرفته برای تعداد کمی از کاربران دارای اشتراک ChatGPT را آغار کرده است، که به آنها اجازه میدهد مکالمات طبیعیتر و درلحظه را امتحان کنند.
حالت صوتی پیشرفته به ChatGPT اجازه میدهد پاسخهای درلحظه ارائه دهد که حتی ممکن است مختل شوند، و همچنین قادر است به طنز، طعنه و موارد دیگر واکنش نشان دهد. این مدل جدید نیازی به تبدیل گفتار شما به متن و برعکس ندارد، که موجب کاهش تاخیر در تعاملات میشود.
OpenAI حالت صوتی پیشرفته را در ماه می نشان داد و صدای هوش مصنوعی به نام Sky را معرفی کرد که به طرز چشمگیری شبیه صدای اسکارلت جوهانسون بود. این صدا بدون اجازه جوهانسون خلق و استفاده شد و او در نهایت بیانیهای در این باره منتشر کرد. او گفت که پیشنهادات متعدد از مدیر عامل OpenAI، سم آلتمن، که میخواست جوهانسون صدای ChatGPT باشد را رد کرده است. او اظهار داشت که “شگفتزده و خشمگین بوده و باورش نمیشود” که آلتمن صدایی خلق کرده که “به طور عجیب و غریبی” شبیه صدای خودش است. OpenAI مدعی شد که قصد نداشته صدای Sky شبیه صدای جوهانسون باشد، اما پس از استخدام مشاور حقوقی توسط جوهانسون، این صدا حذف شد.
به گفته OpenAI از زمان معرفی حالت صوتی پیشرفته، در حال کار بر روی بهبود ایمنی و کیفیت مکالمات صوتی بوده است. حالت صوتی پیشرفته با چهار صدای از پیش تنظیم شده صحبت میکند و برای مسدود کردن خروجیهایی که با این صداها متفاوت هستند طراحی شده است، که از تقلید صدای افراد مشهور جلوگیری میکند. OpenAI همچنین “موانع حفاظی” برای مسدود کردن درخواستهای شامل محتوای خشونتآمیز یا دارای حق کپیرایت پیادهسازی کرده است، و آزمایشهای اولیه برای بهبود این قابلیت قبل از عرضه گستردهتر انجام خواهد شد.
کاربرانی که به حالت صوتی پیشرفته دسترسی پیدا کردهاند، ایمیلی شامل دستورالعمل آن دریافت خواهند کرد، و OpenAI قصد دارد به صورت دورهای تعداد بیشتری از افراد را اضافه کند. همه کاربران اشتراک پلاس نیز در پاییز به حالت صوتی پیشرفته دسترسی خواهند داشت.
نظرات