در طی چند ماه گذشته، محققی به نام Elle Simpson در پی نوشتن رمان خود بود که آنرا با نام ” Gridmark queer science fantasy” توصیف میکرد. زمانیکه فرایند نوشتن کتاب به پایان رسید، تصمیم گرفت تا با طراحی وبسایت، کتاب خود را در دید همگان قرار دهد و فروش محصول خود را با هوش مصنوعی شروع کند.
در این مسیر، یک ایده عجیب ولی خلاقانه در ذهنش جوانه زد. او تصمیم گرفت تا کتاب خود را با تصاویر طراحی شده توسط یکی از قویترین هوش مصنوعیهای جهان تزیین کند که میتواند هنری گیرا و حتی واقع گرایانه را به تصویر بکشد. این مهارت فوق العاده قدرتمند و جدید از طریق دستورهای نوشتاری انجام میشود و کاربران میتوانند با نوشتن هرچیزی که در ذهن و تخیلشان میگذرد تصاویر زیبا و حتی ترسناکی را دریافت کنند که نشان دهنده افکار و موضوعات مختلف است.
اما اکثر این تولید کنندههای عکس، به گونهای طراحی شدهاند که در مقابل تصورات کاربران محدود هستند. به عنوان نمونه: کاربران نمیتوانند تصاویری با عناوین جنسی، خشن و حتی چهره واقعی افراد و سلبریتیها را درخواست کنند. با این وجود، Elle اظهار کرد که این محدودیت عملکرد در مقابل من که کتابی با محتوای خشونت بار نوشتهام امری غیر قابل قبول و ساده لوحانه است و کاربردی برای من ندارد.
خوشبختانه، سیمپسون توانست به انجمن “Unstable Diffusion” در دیسکورد ملحق شود. این انجمن که نام آن از هوش مصنوعی تولید تصاویر نیز گرفته شده از مجموعهای از افراد تشکیل شده است که از نسخه بدون محدودیت این هوش مصنوعی استفاده میکنند.
این کاربران توانستند از طریق هوش مصنوعی Unstable Diffusion تصاویری با محتواهای مختلف را دریافت کنند که نسبت به نسخه قبلی بهبود یافته بود و عملکرد بهتری را نشان میداد. این هوش مصنوعی توانایی بالایی در طراحی اعضای بدن دارد و به لطف این ابزار و آزادی عمل آن، سیمپسون توانست تصاویر مطلوبی را برای کتاب خود جمع آوری کند و فرایند کار خود را آسانتر کند.
تولد و تکامل
در حال حاضر، قویترین پروژههای هوش مصنوعی در داخل شرکتهای مشهور جهان نگهداری میشوند و توسعه مییابند که دسترسی به آنها غیر ممکن است و حتی بعضی از آنها به دلیل فوق پیشرفته بودن و قابلیتهای خطرناک از دسترس خارج شدهاند.
در طی چند سال گذشته، محققان هوش مصنوعی در تلاش بودند تا ابزارهای مختلفی را برای مردم تولید کنند که یکی از آنها تولید کننده تصاویر است. این ابزار نیز زیر بار نقد و انتقادات زیادی قرار گرفت و بسیاری بر این باور هستند که بعضی از کاربران از انواع این هوش مصنوعی برای ساخت تصاویر نامناسب برای ساخت تصویر افراد مشهور استفاده میکنند. در کنار این موارد، دیپ فیک نیز یکی از بخشهایی است که اطلاعات نادرستی را در سطح جهان پخش میکند.
بعضی از طرفداران این انجمن نیز بر این باور هستند که این نوع از هوش مصنوعی میتواند در شبکههای اجتماعی مانند یوتیوب مورد استفاده قرار بگیرد و محتوای نامناسبی را از کودکان تولید کند.
بعضی از اعضای این انجمن میگویند:
این افراد در بخشهای تاریکی از اینترنت فعالیت میکنند و هوش مصنوعی همانند کلیدی است که درب آرزو هایشان را باز میکند
اما بخش اصلی داستان را فردی به نام Emad Mostaque بر عهده دارد که مدیر بودجه بریتانیا است. این شخص و گروه خود هوش مصنوعی Stable Diffusion را با کمک هوش مصنوعی Stability ساخته و در حال حاضر روی ساخت مدلهای بیشتری از هوش مصنوعی تمرکز میکند.
Mostaque میگوید که این ایده به منظور ساخت و توسعه هوش مصنوعی قوی تر و قابل دسترستری ساخته شده و همچنین مسیر شرکت تولید کننده را به بخش تجاری سازی این فناوری رسانده است.
او همچنین میگوید:
ما از این هوش مصنوعی و هنر طراحی متن باز تخیلی به گونهای حمایت میکنیم که همه بتوانند از آن استفاده کنند.
در کنار این موارد و نشان دادن علاقه کاربران به این هوش مصنوعی، بسیاری از توسعه دهندگان پلاگینهایی را طراحی کردهاند که کاربران میتوانند این هوش مصنوعی را در برنامههای ادیت عکس مانند: فوتوشاپ و فیگما استفاده کنند. اضافه کردن این هوش مصنوعی و قابلیتهای آن در برنامههای گرافیکی میتواند حالتهای هنری و کاربردی را روی عکسهای قبلی و در حال ادیت اعمال کند و تجربه کاربری شما را نسبت به قبل بهبود دهد.
نسخه رسمی هوش مصنوعی Stable Diffusionَ شامل محدودیتهایی در تولید تصاویر میشود که در آن کاربران نمیتوانند عکسهای نامناسبی را تولید کنند و از دیگران سو استفاده کنند. با این وجود، کدهای کامل بخش AI model این هوش مصنوعی نیز در دسترس است و قابلیتهای بدون محدودیتی را در اختیار شما میگذارد که نباید از آن سو استفاده کنید.
Mostaque همچنین گفت که اگرچه ممکن است بعضی از تصاویر تولید شده تسط این هوش مصنوعی بی مزه و حتی نامرتبط به توضیحات باشند، اما در نظر داشته باشید که کارکرد این هوش مصنوعی نیز نسبت به سایر ابزارهای طراحی تصاویر متفاوت نیست.
به علاوه، استفاده درست یا نادرست این هوش مصنوعی بر عهده کاربر است و باید مسولیت آنرا قبول کند. این هوش مصنوعی میتواند تصاویر غیر قانونی را طراحی کند که تمامی آنها به قصد و تصورات کاربر بر میگردد و نباید صرفا به دنبال اهداف منفی باشد.
تولید کنندههای تصویر مانند: Stable Diffusion میتوانند تصاویر واقعی را همانند مدلهای موجود در فوتوشاپ و یا حتی مدلهای دستی طراحی کنند و نتایج ساخته شده به شدت بر تصورات و قوه تخیل شما بستگی دارد. به لطف الگوریتمهای یادگیری و دیتابیس بزرگ این هوش مصنوعی که مرتبط به متن است، Stable Diffusion میتواند عملکرد خود را با متون وقف دهد و پس از ساخت تصاویر، نویزهای موجود را حذف کند.
به دلیل اینکه Stable Diffusion از تصاویر موجود در وب برای الهام گرفتن و ساخت تصاویر جدید استفاده میکند، نتایج دریافت شده از این هوش مصنوعی شامل محتوای مختلفی میشود که گاه باب طبع کاربر است و گاهی اوقات نیست. یکی دیگر از نگرانیهای کاربران در رابطه با این هوش مصنوعی که قبلا نیز گفته شد، دیپ فیک و استفاده از گفتههای تایید نشدهای است که روی چهره افراد مشهور جهان قرار میگیرد و مردم جهان را با اطلاعات اشتباه گمراه میکند.
عملکرد باکیفیت هوش مصنوعیهای تولید کننده تصویر از سال پیش آغاز شد. زمانیکه کمپانی Oper Ai از سیستم Dall_E رونمایی کرد و پس از مدتی با ساخت تصاویر از طریق متن به شهرت رسید. پس از این دستاورد انقلابی، کمپانی Open Ai از هوش مصنوعی قدرتمند دیگری به نام Dall_E رونمایی کرد که برای استفاده های تجاری در دسترس قرار گرفته است.
در ابتدا، Open AI کاربران را از دسترسی به هوش مصنوعی محدود کرده بود و تنها میتوانستند از طریق وارد کردن دستور به فیلترها و عکسهای درخواست شده دسترسی داشته باشند. همانطور که گفته شد،Stable Fusion اولین هوش مصنوعی تولید کننده تصاویر نیست و ابزارهایی مانند Dall_E نیز در سال گذشته نظر بسیاری از کاربران را به خود جلب کردند.
به علاوه، یکی از توسعهدهندگان، مدلی شبیه به هوش مصنوعی Dalle_E طراحی کرد و آنرا در دسترس همگان قرار داد.پس از معرفی، این هوش مصنوعی تبدیل به گزینه خاصی برای تولید تصاویر خنده دار شد و پس از آن نیز به Craiyon تغییر نام داد.
مدیر عامل Open Ai میگوید:
روند استفاده از هوش مصنوعی در حالتی مشکل ساز میشود که تنها شرکتهای محدود و قدرتمند از آن برای به تحقق رسیدن اهدافشان استفاده کنند.
اگر به دوران طولانی مدت توسعه فناوری نگاهی بیندازیم، متوجه میشویم که با فراگیر شدن و تعامل بیشتر با این نوع از ابزارها میتوانیم با نوع عملکرد و کنترل امنیت خود آشنا شویم.
فناوریهایی مانند هوش مصنوعی که بسیاری از شرکتها آنرا مخفی کردهاند برای احاد مردم و متخصصان به سختی قابل فهم هستند.از اینرو، بهتر است تا این بخش از جامعه انسانی از چنین ابزارهایی استفاده کنند و پس از ارزیابی، مشکلات آنها را بیان کنند.
در این بین، دسترسی آزاد این نوع از ابزارها اگرچه با مزایای زیادی همراه بوده، اما خطرات بسیاری را بوجود می آورد و آن هم استفاده نادرست از هوش مصنوعی و ابزارهای این حوزه است.
نظرات