پس از شرکت در کارگاه معروف ChatGPT که توسط Jordi برگزار شد، سوالی مهم مطرح شد که حالا به موضوع اصلی این مطلب تبدیل شده است:
آیا رابطهای پردازش زبان طبیعی (همانند ChatGPT) جایگزین رابطهای گرافیکی خواهند شد؟
در چند سال گذشته، چت باتها حضور خود را به شکل پیوسته و گاهی ناپیوسته ثابت کردند و عرصه کوچک آنها در آن دوران به یکباره به بمبی بزرگ تبدیل شد. بااینحال، چت باتهای ساخته شده در آن زمان به اندازه کافی قدرتمند نبودند که به عنوان نماد یک انقلاب شناخته شوند؛ از اینرو، بعضی از آنها شکست را پذیرفتند و سایر نمونهها در سکوت به کار خود ادامه دادند.
در آن سالها، فناوری به شکل چهار دست و پا مسیر خود را طی میکرد و تجربه کاربری فاصله زیادی با کلمه لذتبخش داشت. اما حالا چندین ماه از سال ۲۰۲۳ می گذرد و برقراری ارتباط با ChatGPT حسی طبیعی و ترسناک را به کاربر القا میکند.
تعامل طبیعی
در کتاب ” The Design of Future Things” دونالد نورمن به جنبههای مختلف طراحی و تعامل انسان با فناوری پرداخته است. درحالیکه تمرکز اصلی این کتاب روی موضوع طراحی فناوریهای آینده گذاشته شده، اما نورمن نیم نگاهی نیز به مفهوم تعامل طبیعی کرده است.
نورمن در کتاب خود بر اهمیت طراحی فناوری که به شکل همگام با توانایی و رفتار انسان همراه است تاکید میکند. او اذعان میکند که فناوری باید به گونهای طراحی شود که از تعامل طبیعی پشتیبانی کند. علاوه براین، کاربران باید به سادگی با نحوه تعامل با رابط کاربری کنار بیایند و دستگاههای هوشمند را بدون هیچ پیچیدگی و آموزش کنترل کنند.
نورمن همچنین به این ایده انتقاد کرد که کاربران باید با رابطهای گرافیگی سازگار شوند و پیشنهاد کرد که توسعه دهندگان و متخصصان حوزه فناوری باید محصولی را تولید کنند که با کاربران کنار بیاید. یکی از درخواستهای نورمن و موضوعی که در این کتاب به آن توجه شده است، نیاز طراحی رابط ادراکی است که برای برقراری تعامل با آن به مهارت و تواناییهای طبیعی انسان نیاز است؛ این موضوع شامل طراحی دستگاه و سیستمی است که میتواند به واسطه درک، حافظه و شناخت انسان با او ارتباط برقرار کند و کاربر را از شر رابطهای گرافیکی پیچیده و متنوع خلاص کند.
اما حالا به پردازش زبان طبیعی فکر کنید. به لطف این فناوری دیگر خبری از زبان اختصاصی ad Hoc و نشانه شناسی جدید نیست و این به معنای دستیابی به پیشرفت تعامل طبیعی است.
هرچی که می درخشد طلا نیست
اگرچه پردازش زبان طبیعی پیشرفت های قابل توجهی را در چندسال گذشته تجربه کرده است، اما همچنان با چالشهای مختلفی روبرو هستیم که بی پاسخ باقی ماندهاند.
- فهم متون و حس مشترک: مدلهای پردازش زبان طبیعی همواره در فهم متون و حس مشترک که برای تفسیر دقیق زبان مورد استفاده قرار میگیرند دست و پا میزنند. مدلهایی مانند: ChatGPT 3 اگرچه میتواند به شکل معقولانهای پاسخ کاربران را بدهد، اما پاسخهای اشتباه و بی معنی آنها نیز به دلیل محدودیت در فهم متون گسترده مکالمات و دانش جهان بر همگان واضح و مبرهن است.
- رسیدگی به ابهام و رفع آن: زبان ذاتا مبهم است و مدلهای پردازش زبان طبیعی ممکن است با ابهام زدایی رابطه خوبی نداشته باشند. حل ارجاعات مبهم، معانی کلمات یا تفسیر و ترجمه دقیق و پیوسته عبارات و اصطلاحات یک کار چالش برانگیز برای سیستمهای پردازش زبان طبیعی است.
- برخورد با لغات کمیاب و مواردی که در دیتاست مدل زبانی وجود ندارند: مدلهای زبانی از مجموعه بزرگی از دادهها یاد می گیرند، اما بعضی اوقات ممکن است با کلمات کمیاب و مواردی روبرو شویم که در دسترس مدلهای زبانی قرار نگرفته است؛ از اینرو، رسیدگی به کلمات خارج از دسترس مدل زبانی و بروزرسانی آن همچنان به عنوان یک چالش قلمداد میشود.
- مشاهده جانبداری و موارد اخلاقی: مدلهای پردازش زبان طبیعی به شکل غیر عمد به ارائه اطلاعات غلط محکوم میشوند. ممکن است این مدلها پاسخهایی درباره جانبداری جنسی، قومی و فرهنگی ارائه دهند که به مذاق بسیاری از کاربران خوش نیاید. این وضعیت برای موارد اخلاقی نیز مشابه است و بااینکه بسیاری از دولتها و کاربران از برخورد آن راضی نیستند، اما به عنوان چالشی حل نشده باقی مانده است.
آموزش حذف حساب ChatGPT با چند روش ساده
- اساس زبان در فیزیک جهان: فهم زبان در ارتباط با فیزیک جهان یک چالش بوده و هست. درحالیکه پیشرفت در زمینههایی مانند شرح تصویر یا پاسخ به سؤالات بصری حاصل شده، اما ادغام کامل اطلاعات بصری یا حسگر داده با فهم زبان همانند یک چالش باقی مانده است.
- فهم متون زمانیکه مکالمه کاربر با مدل زبان طبیعی بیش از حد افزایش پیدا می کند: در اکثر مواقع، مدلهای پردازش زبان طبیعی نمیتوانند عملکرد درستی را حین افزایش مکالمه با کاربر داشته باشند. حفظ معقولانه مکالمه و فهم موضوعات اگرچه برای آنها در نظر گرفته شده است، اما به سختی و گاهی نمیتواند کیفیت مکالمه را حفظ کنند؛ مشکلی که بعضی از انسانها نیز با آن دست و پنجه نرم میکنند.
- استدلال و ارائه توضیحات: درحالیکه مدلهای زبان طبیعی میتوانند پاسخهایی تا حدی معقولانه را به کاربر ارائه دهند، اما آنها از توانایی استدلال منطقی و صریح بهره مند نیستند و در صورت توضیح تصمیمات خود، دست به دهان میمانند.
رابط های گرافیکی و امکانات
در حالت ایدهآل طراحی مطلوب باید امکانات بصری و واضح را ارائه دهد و این امکان را برای کاربر فراهم کند تا به آسانی نحوه استفاده و تعامل با سیستم و اجزا را یاد بگیرد و پیشبینی کند.
بازخوردها به کاربران کمک میکنند تا از نتایج کارهای خود آگاه شوند و اطلاعاتی را درباره وضعیت سیستم ارائه دهد. بازخوردهای کاربردی به کاربر کمک میکنند تا با طراحی رابط به تعامل بپردازد و دچار سردرگمی نشود.
زمانیکه رابطهای کاربری گرافیکی به درستی طراحی شوند، این توانایی را خواهند داشت تا به شکلی با کاربران تعامل برقرار کنند که کاربران تواناییها و قابلیتهای آنها را درک کنند و رفتار سیستم را پیشبینی کنند. در کل، رابطهای زبان طبیعی در ارائه این ارزیابیها به مشکل بر میخورند و همانند انسانها، نمیدانید که باید انتظار چه چیزی را بکشید.
جمع بندی
با توجه به محدودیتهای فعلی فناوری، بعید است که رابطهای کاربری گرافیکی به طور کامل با رابطهای مبتنی بر چت در همه حالات جایگزین شوند. انواع رابطها اهداف مختلفی را نیز دنبال میکنند و هرکدام مزایا و معایب مخصوص به خود را دارند. رابطهای گرافیکی برای ارائه جلوههای بصری، ترکیب دادههای پیچیده و وظایفی که نیازمند ورودی و کنترل دقیق هستند کاربردی است. این رابط برای وظایفی مانند: طراحی گرافیکی، ویرایش ویدئو یا کار با مجموعه بزرگی از دادهها مناسب است.
در سمتی دیگر، رابطهای مبتنی بر چت برای وظایفی مطلوب هستند که به تعامل با زبان طبیعی، پیشنهادات شخصی سازی شده و بازیابی اطلاعات خلاصه میشوند. آنها میتوانند به ویژه در بخش پشتیبانی مشتری، دستیار شخصی و روایت داستان تعاملی مورد استفاده قرار بگیرند.
در بسیاری از موارد، ترکیبی از این دو رابط ممکن است برای بکارگیری یک رابط کاربری جامع استفاده شود. به عنوان مثال، یک رابط مبتنی بر چت میتواند دستورات و پرس و جوهای سطح بالا را مدیریت کند، در حالی که یک رابط گرافیکی میتواند برای کنترل دقیقتر استفاده شود
در پایان، اگرچه رابطهای مبتنی بر چت این پتانسیل را دارند تا به شکل قابل توجهی روی تعامل با سیستمهای دیجیتالی تاثیر بگذارند، اما خبری از جایگزین شدن رابطهای گرافیکی با آنها نخواهد بود. همزیستی و ادغام مدلهای مختلف رابط، به احتمال زیاد آینده تعامل کاربر را شکل خواهند داد.
نظرات