گوگل در روز گذشته در شهر مونتن ویو (واقع در ایالت کالیفرنیای آمریکا) و با دعوت از چند گروه محدود خبرنگاری فرصت استفاده از پیشنمایش گوگل دوپلکس (Google Duplex) را به آنها داد. دوپلکس گوگل یک سیستم هوش مصنوعی است که یک سری از کارهای روتین مثل رزرو کردن رستوران یا نوبت آرایشگاه گرفتن را به صورت تلفنی و خودکار برای شما انجام میدهد. دوپلکس این کار را آنقدر طبیعی انجام میدهد که شخص مخاطب آن نمیتواند تشخیص دهد در حال مکالمه با یک سیستم کامپیوتری است. خبرنگاناران دعوت شده چگونگی دریافت تماس دوپلکس توسط رستوران را شاهد بودند. در حقیقت هر یک از خبرنگاران به نوبهی خود و به عنوان منشی رستوران با دوپلکس حرف زدند و سعی کردند که یک نوبت برای آن رزرو کنند.
گوگل قصد دارد جلسات دیگری در هفتههای آتی و به همین منوال با گروههای خبری برگزار کند. گروههای دعوت شده نیز محدود به آزمایش کنندگان قابل اطمینان گوگل هستند. به گفته نیک فاکس (Nick Fox: معاونت محصول و طراحی برای دستیار گوگل) همچنین آزمایشهای بعدی محدود به چند کسب و کار که گوگل با آنها همکاری میکند خواهند بود و نه هر رستوران یا مغازهی دیگر.
برنامهریزی برای آزمایش دوپلکس، مرحلهای خواهد بود. ابتدا رزرو دستوران برای تعطیلات را خواهیم داشت. بعد از آن شاهد رزرو رستوران برای تابستان خواهیم بود و در آخر نوبت گرفتن از آرایشگاه در دستور کار گوگل برای پیشنمایش دوپلکس قرار دارد. اینها تنها سه حوزهای هستند که دوپلکس برای آنها آموزش داده شده است.
در پیشنمایش گذشته، خیلی از عناصری که باعث شد دوپلکس بعد از نمایش اصلی آن در ماه می سر و صدایی به پا کند را شاهد بودیم. صدای دوپلکس بسیار شبیه به صدای انسان عادی بود. جملات دارای کلمات زبانی مثل «ممم» و «اِ» بودند. همچنین هر مکالمه با پیام «این مکالمه ضبط میشود» شروع میشد که در نمایش اصلی ماه می شاهد آن نبودیم.
چندین تغییر در این پیشنمایش نسبت به نمایش اصلی شاهد بودیم که تمام آنها در جهت بیان اینکه در حال صحبت با دستیار صوتی گوگل هستید بودند. به عنوان مثال:
سلام، من برای رزرو یک وقت تماس میگیرم. من سیستم رزرو نوبت گوگل هستم پس تماس را هم ضبط میکنم. اِاِ میشه یک میز برای یکشنبه آینده برای من رزرو کنید؟
چند نکته راجب به پیشنمایش دوپلکس را بیان خواهیم کرد. صدای دوپلکس بسیار طبیعی است که تشخیص آن را از صدای انسان واقعی را سخت میکند. در هر تماس شاهد یک سری تفاوت در گفتار دوپلکس بودیم. ظاهرا گوگل میخواهد ببیند که مردم با کدام روش ارتباط بیشتری برقرار میکنند. تمام تماسهای پیشنمایش با عبارت «تماس ضبط میشود» آغاز میشدند که سریع بعد از آن با عبارت زبانی «ممم» یا مشابه آن، قبل از درخواست رزرو میز مواجه میشدیم.
صدای طبیعی انسانی در نسخههای اولیه دوپلکس قرار نداشت و دوپلکس با اشکالات فراوانی در این زمینه مواجه بود. اسکات هافمن (Scott Huffman: معاونت مهندسی گوگل) در این زمینه گفته است:
… در ابتدا اصلا نتیجهای نمیگرفتیم… ما با پاتوقهای زیاد مواجه بودیم… خیلی از درخواستها نیمه کاره باقی میماندند. مردم با صدای غیر طبیعی ارتباط برقرار نمیکردند.
یکی از راههای گوگل برای طبیعیتر ساختن صدای دوپلکس، اضافه کردن مم و اِ به آن بود. هافمن در این باره تصریح کرده بود که ما قصد فریب کسی را نداریم. این عبارتها (مم و اِ) در مکالمه روزمرهی انسانها نقش کلیدی را دارند. او میگوید که این عبارتها در شاخهای از علم زبان شناسی به نام «پراگماتیکز (pragmatics: عملگرایی)» قرار گرفتهاند. پراگماتیکز شامل تمام ارتباطات غیر کلامی است که در سخنرانی انسان رخ میدهد. مانند: مم و اِ و اهم و اشارههای دست و …
فاکس نیز گفت:
اگر زمانی که دوپلکس میگوید این تماس ضبط میشود و در زمان کلمه «مم»، فرصت را غنیمت بشمارید و بگویید نه نمیخواهم آن را ضبط کنید؛ دوپلکس این پیام را تشخیص داده و پاسخ میدهد: باشد، تماس را پایان میدهم و بعدا و از طریق خط دیگری با شما تماس میگیرم که ضبط نشود.
فاکس اضافه میکند:
دوپلکس در تمام شرایط کار نمیکند. در بعضی از ایالتها مانند تکزاس کار نخواهد کرد. البته به زودی اکثر قریب به تمام ایالتها به دایره پشتیبانی اضافه خواهند شد. دوپلکس فقط به زبان انگلیسی کار میکند ولی گوگل اطمینان خود را حاصل کرده که گویشهها و لهجههای متعددی قابل شناسایی هستند.
فاکس تایید کرد که رفتار گوگل ناشی از «اصول هسته هوشمصنوعی (core AI principles)» است، که اخیرا توسط گوگل توسعه یافته. همچنین اضافه کرده که گوگل در این زمینه بسیار محطاط عمل خواهد کرد و به همین دلیل است که آزمایشهای اولیه محدود به شرکای گوگل است. البته گزینه رد کردن دوپلکس نیز برای صاحبان کسب و کارها موجود است، به این صورت که میتوانند اعلام کنند تمایلی به دریافت تماس از سوی دوپلکس نیستند. این کار احتمالا از طریق سرویس کسب و کار من (My Business) انجام خواهد پذیرفت.
آقای فاکس اضافه کرد:
ما به تمام کسب و کارهایی که با ما کار میکنند احترام فراوانی قائلیم… گوگل مطمئن خواهد شد که کسب و کارها، تماسهای زیادی از دوپلکس دریافت نخواهند کرد. به عنوان مثال تماسهای دریافتی از افرادی که میخواهند به وسیله دوپلکس، رستورانها را اذیت کنند یا بخواهند رزروهای سرکاری داشته باشند متوقف خواهند شد.
هنگامی که دوپلکس را با دستیار صوتی گوگل هماهنگ شود، کاربر مقداری اطلاعات و اجازه را به آن میدهد. گوگل هنوز اطلاعات زیادی از اطلاعاتی که از کاربر گرفته میشود منتشر نکرده است ولی به عنوان مثال برای نوبت آرایشگاه گرفتن، نیاز به دانستن مدل موی معمول شما است.
در مکالمههای شنیده شده، دوپلکس بسیار مؤدبانه ظاهر شده است. مثلا هنگامی که اپراتور انسانی از دوپلکس خواست که صبر کند، دوپلکس با گفتن «اهم» توجه خود نسبت به سخن اپراتور را نشان داد. این چیزی است که هافمن از آن «هوشیاری مکالمهای» تعبیر کرد.
وقفههای کم نظیر در صحبت کردنها، سؤالات خارج از درخواست و حتی استدلالهای قیاسی عجیب از تواناییهای دوپلکس هستند. وقتی اپراتور گیج یا دست پاچه شود، دوپلکس لحن عذرخواهانه به خود میگیرد. ظاهرا دوپلکس از آن دسته از مشتریانی است که رعایت حال اپراتور را میکنند و حتی در پشت تلفن نیز یک مشتری با شخصیت شناخته میشوند.
البته دوپلکس نمیتواند همه چیز را به تنهایی پیش ببرد. اگر یک مکالمه به خوبی پیش نرود، اپراتورهای انسانی فراوانی هستند که در این صورت کار را به دست خود خواهند گرفت. در واقع دوپلکس یک سیستم با پشتیبانی انسانی است. وجود این اپراتورهای انسانی، با استناد به سخنان والری نیگارد (Valerie Nygaard: مدیر محصول)، برای دو هدف در نظر گرفته شده است. اول ادامه مکالمه، وقتی که دوپلکس از ادامه آن ناتوان باشد و دوم گلچین مکالمات و استفاده از آنها برای ارتقای الگوریتم هوش مصنوعی دوپلکس.
در پیشنمایش برگزار شده، هیچ کدام از مکالمات نیاز به پشتیبان انسانی نداشتند اما هافمن میگوید که از هر ۵ تماس، ۴تای آنها بدون پشتیبانی انسانی پایان میپذیرد که این نسبت با توجه به دیدگاهها از تکنولوژی میتواند کم یا زیاد باشد.
شاید تا این جای کار این دستاورد گوگل غیرقابل باورباشد ولی دلایلی برای واقعی بودن آن ذکر میکنیم:
خبرگزار سایت ورج، نقش یک منشی عصبی که سرش شلوغ است را بازی کرد. او دوپلکس را چندین دفعه به حالت وقفه برد ولی دوپلکس به خوبی از پس آنها بر آمد تا این که سیستم بالاخره کم آورد. هنگامی که این خبرنگار گفت که میتواند یک نوبت برای ساعت ۷ برای دوپلکس بگیرد درحالی که آشپزخانه رستوران ساعت ۶ تعطیل میکند و آنها باید تا ساعت ۷ منتظر بمانند، دوپلکس از جواب دادن عاجز ماند و اصطلاحا هنگ کرد.
در آن لحظه میبایست تماس به پشتیبان انسانی منتقل میشد ولی عوض آن چند صدای بوق اذیت کننده از تلفن آمد و در نهایت دوپلکس گفت:
بله، درست میگویید، خداحافظ و ممنون و تماس قطع شد.
به هر حال هنوز کارهای انسانی زیادی است که باید روی این سیستم انجام شود.
نظرات