شرح پیش نمایش دوپلکس، دوپلکس واقعا کار می‌کند + جزئیات کامل - تکفارس 
شرح پیش نمایش دوپلکس، دوپلکس واقعا کار می‌کند + جزئیات کامل - تکفارس 

شرح پیش نمایش دوپلکس، دوپلکس واقعا کار می‌کند + جزئیات کامل

دانیال بالِدی
۷ تیر ۱۳۹۷ - 17:00
شرح پیش نمایش دوپلکس، دوپلکس واقعا کار می‌کند + جزئیات کامل - تکفارس 

گوگل در روز گذشته در شهر مونتن ویو (واقع در ایالت کالیفرنیای آمریکا) و با دعوت از چند گروه محدود خبرنگاری فرصت استفاده از پیش‌نمایش گوگل دوپلکس (Google Duplex) را به آن‌ها داد. دوپلکس گوگل یک سیستم هوش مصنوعی است که یک سری از کارهای روتین مثل رزرو کردن رستوران یا نوبت آرایشگاه گرفتن را به صورت تلفنی و خودکار برای شما انجام می‌دهد. دوپلکس این کار را آنقدر طبیعی انجام می‌دهد که شخص مخاطب آن نمی‌تواند تشخیص دهد در حال مکالمه با یک سیستم کامپیوتری است. خبرنگاناران دعوت شده چگونگی دریافت تماس دوپلکس توسط رستوران را شاهد بودند. در حقیقت هر یک از خبرنگاران به نوبه‌ی خود و به عنوان منشی رستوران با دوپلکس حرف زدند و سعی کردند که یک نوبت برای آن رزرو کنند.

گوگل قصد دارد جلسات دیگری در هفته‌های آتی و به همین منوال با گروه‌های خبری برگزار کند. گروه‌های دعوت شده نیز محدود به آزمایش کنندگان قابل اطمینان گوگل هستند. به گفته نیک فاکس (Nick Fox: معاونت محصول و طراحی برای دستیار گوگل) هم‌چنین آزمایش‌های بعدی محدود به چند کسب و کار که گوگل با آن‌ها همکاری می‌کند خواهند بود و نه هر رستوران یا مغازه‌ی دیگر.

برنامه‌ریزی برای آزمایش دوپلکس، مرحله‌ای خواهد بود. ابتدا رزرو دستوران برای تعطیلات را خواهیم داشت. بعد از آن شاهد رزرو رستوران برای تابستان خواهیم بود و در آخر نوبت گرفتن از آرایشگاه در دستور کار گوگل برای پیش‌نمایش دوپلکس قرار دارد. این‌ها تنها سه حوزه‌ای هستند که دوپلکس برای آن‌ها آموزش داده شده است.

در پیش‌نمایش گذشته، خیلی از عناصری که باعث شد دوپلکس بعد از نمایش اصلی آن در ماه می سر و صدایی به پا کند را شاهد بودیم. صدای دوپلکس بسیار شبیه به صدای انسان عادی بود. جملات دارای کلمات زبانی مثل «ممم» و «اِ» بودند. هم‌چنین هر مکالمه با پیام «این مکالمه ضبط می‌شود» شروع می‌شد که در نمایش اصلی ماه می شاهد آن نبودیم.

چندین تغییر در این پیش‌نمایش نسبت به نمایش اصلی شاهد بودیم که تمام آن‌ها در جهت بیان اینکه در حال صحبت با دستیار صوتی گوگل هستید بودند. به عنوان مثال:

سلام، من برای رزرو یک وقت تماس می‌گیرم. من سیستم رزرو نوبت گوگل هستم پس تماس را هم ضبط می‌کنم. اِاِ میشه یک میز برای یکشنبه آینده برای من رزرو کنید؟

چند نکته راجب به پیش‌نمایش دوپلکس را بیان خواهیم کرد. صدای دوپلکس بسیار طبیعی است که تشخیص آن را از صدای انسان واقعی را سخت می‌کند. در هر تماس شاهد یک سری تفاوت در گفتار دوپلکس بودیم. ظاهرا گوگل می‌خواهد ببیند که مردم با کدام روش ارتباط بیش‌تری برقرار می‌کنند. تمام تماس‌های پیش‌نمایش با عبارت «تماس ضبط می‌شود» آغاز می‌شدند که سریع بعد از آن با عبارت زبانی «ممم» یا مشابه آن، قبل از درخواست رزرو میز مواجه می‌شدیم.

شرح پیش نمایش دوپلکس، دوپلکس واقعا کار می‌کند + جزئیات کامل - تکفارس شرح پیش نمایش دوپلکس، دوپلکس واقعا کار می‌کند + جزئیات کامل - تکفارس 

صدای طبیعی انسانی در نسخه‌های اولیه دوپلکس قرار نداشت و دوپلکس با اشکالات فراوانی در این زمینه مواجه بود. اسکات هافمن (Scott Huffman: معاونت مهندسی گوگل) در این زمینه گفته است:

… در ابتدا اصلا نتیجه‌ای نمی‌گرفتیم… ما با پاتوق‌های زیاد مواجه بودیم… خیلی از درخواست‌ها نیمه کاره باقی می‌ماندند. مردم با صدای غیر طبیعی ارتباط برقرار نمی‌کردند.

یکی از راه‌های گوگل برای طبیعی‌تر ساختن صدای دوپلکس، اضافه کردن مم و اِ به آن بود. هافمن در این باره تصریح کرده بود که ما قصد فریب کسی را نداریم. این عبارت‌ها (مم و اِ) در مکالمه روزمره‌ی انسان‌ها نقش کلیدی را دارند. او می‌گوید که این عبارت‌ها در شاخه‌ای از علم زبان شناسی به نام «پراگماتیکز (pragmatics: عملگرایی)» قرار گرفته‌اند. پراگماتیکز شامل تمام ارتباطات غیر کلامی است که در سخنرانی انسان رخ می‌دهد. مانند: مم و اِ و اهم و اشاره‌های دست و …

فاکس نیز گفت:

اگر زمانی که دوپلکس می‌گوید این تماس ضبط می‌شود و در زمان کلمه «مم»، فرصت را غنیمت بشمارید و بگویید نه نمیخواهم آن را ضبط کنید؛ دوپلکس این پیام را تشخیص داده و پاسخ می‌دهد: باشد، تماس را پایان می‌دهم و بعدا و از طریق خط دیگری با شما تماس می‌گیرم که ضبط نشود.

فاکس اضافه می‌کند:

دوپلکس در تمام شرایط کار نمی‌کند. در بعضی از ایالت‌ها مانند تکزاس کار نخواهد کرد. البته به زودی اکثر قریب به تمام ایالت‌ها به دایره پشتیبانی اضافه خواهند شد. دوپلکس فقط به زبان انگلیسی کار می‌کند ولی گوگل اطمینان خود را حاصل کرده که گویشه‌ها و لهجه‌های متعددی قابل شناسایی هستند.

فاکس تایید کرد که رفتار گوگل ناشی از «اصول هسته هوش‌مصنوعی (core AI principles)» است، که اخیرا توسط گوگل توسعه یافته. هم‌چنین اضافه کرده که گوگل در این زمینه بسیار محطاط عمل خواهد کرد و به همین دلیل است که آزمایش‌های اولیه محدود به شرکای گوگل است. البته گزینه رد کردن دوپلکس نیز برای صاحبان کسب و کارها موجود است، به این صورت که می‌توانند اعلام کنند تمایلی به دریافت تماس از سوی دوپلکس نیستند. این کار احتمالا از طریق سرویس کسب و کار من (My Business) انجام خواهد پذیرفت.

آقای فاکس اضافه کرد:

ما به تمام کسب و کارهایی که با ما کار می‌کنند احترام فراوانی قائلیم… گوگل مطمئن خواهد شد که کسب و کارها، تماس‌های زیادی از دوپلکس دریافت نخواهند کرد. به عنوان مثال تماس‌های دریافتی از افرادی که می‌خواهند به وسیله دوپلکس، رستوران‌ها را اذیت کنند یا بخواهند رزروهای سرکاری داشته باشند متوقف خواهند شد.

هنگامی که دوپلکس را با دستیار صوتی گوگل هماهنگ شود، کاربر مقداری اطلاعات و اجازه را به آن می‌دهد. گوگل هنوز اطلاعات زیادی از اطلاعاتی که از کاربر گرفته می‌شود منتشر نکرده است ولی به عنوان مثال برای نوبت آرایشگاه گرفتن، نیاز به دانستن مدل موی معمول شما است.

در مکالمه‌های شنیده شده، دوپلکس بسیار مؤدبانه ظاهر شده است. مثلا هنگامی که اپراتور انسانی از دوپلکس خواست که صبر کند، دوپلکس با گفتن «اهم» توجه خود نسبت به سخن اپراتور را نشان داد. این چیزی است که هافمن از آن «هوشیاری مکالمه‌ای» تعبیر کرد.

وقفه‌های کم نظیر در صحبت کردن‌ها، سؤالات خارج از درخواست و حتی استدلال‌های قیاسی عجیب از توانایی‌های دوپلکس هستند. وقتی اپراتور گیج یا دست پاچه شود، دوپلکس لحن عذرخواهانه به خود می‌گیرد. ظاهرا دوپلکس از آن دسته از مشتریانی است که رعایت حال اپراتور را می‌کنند و حتی در پشت تلفن نیز یک مشتری با شخصیت شناخته می‌شوند.

البته دوپلکس نمی‌تواند همه چیز را به تنهایی پیش ببرد. اگر یک مکالمه به خوبی پیش نرود، اپراتورهای انسانی فراوانی هستند که در این صورت کار را به دست خود خواهند گرفت. در واقع دوپلکس یک سیستم با پشتیبانی انسانی است. وجود این اپراتورهای انسانی، با استناد به سخنان والری نیگارد (Valerie Nygaard: مدیر محصول)، برای دو هدف در نظر گرفته شده است. اول ادامه مکالمه، وقتی که دوپلکس از ادامه آن ناتوان باشد و دوم گلچین مکالمات و استفاده از آن‌ها برای ارتقای الگوریتم هوش مصنوعی دوپلکس.

در پیش‌نمایش برگزار شده، هیچ کدام از مکالمات نیاز به پشتیبان انسانی نداشتند اما هافمن می‌گوید که از هر ۵ تماس، ۴تای آن‌ها بدون پشتیبانی انسانی پایان می‌پذیرد که این نسبت با توجه به دیدگاه‌ها از تکنولوژی می‌تواند کم یا زیاد باشد.

شاید تا این جای کار این دستاورد گوگل غیرقابل باورباشد ولی دلایلی برای واقعی بودن آن ذکر می‌کنیم:

خبرگزار سایت ورج، نقش یک منشی عصبی که سرش شلوغ است را بازی کرد. او دوپلکس را چندین دفعه به حالت وقفه برد ولی دوپلکس به خوبی از پس آن‌ها بر آمد تا این که سیستم بالاخره کم آورد. هنگامی که این خبرنگار گفت که می‌تواند یک نوبت برای ساعت ۷ برای دوپلکس بگیرد درحالی که آشپزخانه رستوران ساعت ۶ تعطیل می‌کند و آن‌ها باید تا ساعت ۷ منتظر بمانند، دوپلکس از جواب دادن عاجز ماند و اصطلاحا هنگ کرد.

در آن لحظه می‌بایست تماس به پشتیبان انسانی منتقل می‌شد ولی عوض آن چند صدای بوق اذیت کننده از تلفن آمد و در نهایت دوپلکس گفت:

بله، درست می‌گویید، خداحافظ و ممنون و تماس قطع شد.

به هر حال هنوز کارهای انسانی زیادی است که باید روی این سیستم انجام شود.

مطالب مرتبط سایت

نظرات

دیدگاهتان را بنویسید