تعریف نفرت پراکنی قانونی (Hate speech) یکی از موضوعات داغ مورد بحث در سال ۲۰۱۸ است. یکی از دلایلی که به شدت در مورد آن بحث میشود دامنهی تعریف آن است. اگر انسانها تعریف نفرت پراکنی را دشوار میدانند، با توجه به یک بررسی جدید از هفت سیستم مختلف کامپیوتری که برای شناسایی چنین عمل آنلاینی فعال بوده، برای ماشینها تعیین دامنهی این تعریف حتی کار سختتری است . این تحقیق همچنین در مورد چگونگی گمراه شدن این سیستمها مطالبی را ارائه نموده است.
محققان دانشگاه آلتوی فنلاند، سیستمهای مختلف ضدنفرت پراکنی ، از جمله ابزارهای ساخته شده توسط تیم مبارزه با سوء استفاده گوگل را مورد بررسی قرار دادند. یافتههای آنها؟ نه تنها سیستمهای مورد استفاده برای نشانه گذاری محتوای توهین آمیز آنلاین بر یک تعریف جامع برای نفرت پراکنی توافق ندارند، بلکه میتوانند به راحتی با یک اشتباه تایپی در کلمات گمراه شوند.
Grondahl Tommi، یکی از محققان پروژه، به Digital Trends گفت:
محققان و شرکتها، تجزیه و تحلیل متنوع متن و روشهای یادگیری ماشین را برای تشخیص گفتار نفرت انگیز به صورت خودکار پیشنهاد کردهاند. با هدف تعمیم دادن فراتر از نمونههای آموزشی، این سیستمها با نمونههایی از متنهای نفرتانگیز و غیر نفرتانگیز آموزش داده میشوند. ما یک سیستم آموزش داده شده با یک مجموعه داده را به مجموعه دادههای دیگر تعمیم دادیم. ما متوجه شدیم که هیچ کدام از آنها در سایر مجموعه دادهها کارکرد خوبی ندارند. این نشان میدهد که آنچه «نفرت پراکنی» نامیده میشود، بین مجموعه دادههای موجود بسیار متفاوت است و نمیتواند به عنوان یک ویژگی قابل تعریف شناخته شود. با توجه به این، ما نباید از هوش مصنوعی انتظار داشته باشیم به جای انسان و به طور کامل در این وظیفه جایگزین شود، همانطور که کار انسانی همچنان مورد نیاز است تا تصمیمات نهایی را درمورد تعیین نفرت پراکنی قانونی بگیرد.
محققان نشان دادند که چگونه همهی هفت سیستم را میتوان به راحتی با حملات سادهی جایگزینی اتوماتیک متن گمراه کرد – مانند ایجاد تغییرات کوچک در کلمات، اضافه یا حذف فاصلهها و یا اضافه کردن کلمات غیر مرتبط. به عنوان مثال، اضافه کردن کلمه “عشق” به یک پیام نفرت پراکنی سیستمهای تشخیص را دچار اشتباه میکند. این ترفندها قادر بودند هم سیستم فیلتر کلمات کلیدی ساده و هم هوش مصنوعی پیچیدهتر براساس سیستمهای مبتنی بر معماری شبکه آموزش عصبی عمیق را فریب دهند
ناکارآمدی ابزارهای نشانه گذاری فعلی برای مقابله با نفرت پراکنی اینترنتی، شوک بزرگ به حساب نمیآید. در حالی که ما برخی از پروژههای نوآورانه و پیشرفته در این حوزه را تحت پوشش قرار دادهایم، تحقیقاتی مانند این نشان میدهد که چقدر به کار بیشتر نیاز است و پروژههایی مانند این باعث خواهد شد محققان دو برابر بیشتر بر روی این چالش کار کنند و هرگز تسلیم نشوند.
نظرات