محبوبیت فناوری هوش مصنوعی مولد، به ویژه مولدهای تصویر، در چند ماه گذشته رشد چشمگیری داشته و حالا کاربران در این بخش از دنیای فناوری به گزینههای متعددی دسترسی دارند. با این وجود، دو هوش مصنوعی میدجرنی (Midjourney) و استیبل دیفیوژن (Stable Diffusion) موفق شدهاند تا نسبت به سایر مولدهای تصویر توجهات بیشتری را به سوی خود جلب کنند.
هرچند که هر دو فناوری عملکرد فوقالعادهای دارند اما از نظر قابلیتهای شخصیسازی، سبک هنری، قیمت و موارد دیگر با یگدیگر تفاوتهایی دارند. در این مقاله به مقایسه این دو هوش مصنوعی مولد تصویر خواهیم پرداخت.
تفاوتها
هر دو هوش مصنوعی میدجرنی و استیبل دیفیوژن در اواسط سال ۲۰۲۲ معرفی شدند و در حال حاضر در ابتدای راه قرار دارند. میدجرنی به عنوان یک سرویس سودمحور طراحی شده اما استیبل دیفیوژن تحت لایسنس متن باز در دسترس قرار گرفته است. از این رو میتوان گفت که اهداف توسعهدهندگان این دو فناوری کاملاً با یکدیگر متفاوت است.
ویژگی متن باز بودن استیبل دیفیوژن باعث شده تا این فناوری از گزینههای شخصیسازی بیشتری پشتیبانی کند و کاربران بیشتری به آن دسترسی داشته باشند. هرچند که امکان استفادهی رایگان از نسخهی تحت وب این سرویس وجود دارد اما برای دریافت بهترین نتیجه، بهتر است تا از اپلیکیشن آن روی کامپیوتر خود استفاده کنید. البته این کار ملزم داشتن دانش فنی کافی برای تولید تصاویر واقعی و باورپذیر است.
در طرف دیگر، میدجرنی به دانش چندان بالایی نیاز نداشته و شما میتوانید با تعیین کردن چند پارامتر برای آن، تصویر مورد نظر خود را تولید کنید. هرچند که دقت تصاویر تولیدشده توسط هر دو هوش مصنوعی بسیار بالاست اما کیفیت تصاویر میدجرنی در مدل جدید V5 آن بسیار بیشتر از قبل شده است. بهطور کلی میتوان گفت که تولید تصاویر در میدجرنی آسانتر از استیبل دیفیوژن است اما در صورتی که وقت کافی برای مشخص کردن پارامترهای تصاویر را داشته باشید، استیبل دیفیوژن نیز میتواند تصاویری با کیفیت مشابه و حتی بالاتر از میدجرنی را تولید کند.
مطالب مرتبط:
ویژگیها
در نگاه اول شاید اینطور به نظر برسد که میدجرنی و استیبل دیفیوژن ویژگیهای یکسانی را ارائه میدهند اما در واقعیت هر دوی آنها دارای مزایا و معایب مخصوص خود میباشند. برای مثال، میدجرنی برخلاف گذشته دیگر از قابلیت آپسکیل پشتیبانی نمیکند اما در طرف دیگر، استیبل دیفیوژن به کاربران امکان دانلود و استفاده چندین مدل آپسکیل را میدهد. همچنین در صورتی که سیستم شما دارای حافظهی گرافیکی کافی باشد، استیبل دیفیوژن میتواند تصاویری با وضوح بیشتر از ۱ مگاپیکسل (میدجرنی) را تولید کند. در قسمت زیر، لیستی از ویژگیهای متفاوت دو فناوری یادشده ارائه شده است:
- Inpainting و Outpainting: در استیبل دیفیوژن شما میتوانید با استفاده از Inpainting بخشهایی از تصویر را تغییر دهید. همچنین تکنیک Outpainting امکان تولید جزئیات جدید برای تصویر را فراهم میکند. هیچ یک از این دو ویژگی ویرایش در میدجرنی وجود ندارد.
- دستور تصویری: در میدجرنی شما میتوانید یک یا دو تصویر را در بخش دستور متنی خود آپلود کنید و هوش مصنوعی نیز با ترکیب متن و تصویر آپلودشده، تصویری را تولید میکند که بیشترین شباهت را به ورودی شما داشته باشد.
- سبک هنری مخصوص: میدجرنی قابلیت تولید تصاویر با سبک انیمه را دارد اما استیبل دیفیوژن پا را از این فراتر گذاشته و امکان دانلود مدلهای شخصیسازیشدهی متعدد با سبکهای متفاوت را فراهم کرده است.
توجه داشته باشید که بسیاری از ویژگیهای استیبل دیفیوژن تنها در نسخهی دسکتاپ آن قابل استفاده بوده و در نسخهی تحت وب آن ارائه نشده است. از این رو میدجرنی برای ساخت تصاویر به صورت آنلاین بهتر است.
قیمت
از آنجایی که میدجرنی یک سرویس سودمحور است، محدودیتهایی در آن وجود دارد. برای مثال شما در آن هر ماه تنها چند ساعت امکان ساخت تصویر بر اساس متن را دارید. همچنین خبری از پلن رایگان یا آزمایشی در این سرویس نبوده و شما باید یکی از پلنهای اشتراکی آن را خریداری کنید. استیبل دیفیوژن از این نظر نقطهی مقابل میدجرنی بوده و شما میتوانید از آن به طور رایگان استفاده کنید اما با این وجود، این فناوری برای ارائهی بهترین عملکرد خود به یک کامپیوتر با کارت گرافیک قدرتمند نیاز دارد. در حال حاضر بیشتر سیستمهای گیمینگ فعلی توانایی اجرای این نرمافزار را دارند اما در صورت نیاز، شما میتوانید از نسخهی تحت وب آن نیز استفاده کنید.
بد نیست بدانید که تیم توسعهدهندهی استیبل دیفیوژن یک اپلیکیشن تحت وب مولد تصویر به نام دریم استودیو (DreamStudio) را نیز در دسترس قرار دادهاند. هرچند که کار با این اپلیکیشن همانند میدجرنی بسیار آسان است اما شما باید برای استفاده از آن حداقل مبلغ ۱۰ دلار را پرداخت کنید. در همین حال، مایکروسافت نیز هوش مصنوعی مولد تصویر Bing Image Creator را در دسترس قرار داده که کاملاً رایگان است.
مطالب مرتبط:
از کدام یک استفاده کنیم؟
تصاویر زیر به خوبی تفاوت میدجرنی و استیبل دیفیوژن در ساخت تصویر بر اساس دستور متنی کاربر را نشان میدهند. در دو تصویر اول شاهد تصاویر تولیدشده بر اساس دستور”جنگ ستارگان دارث ویدر با سبک سایبرپانک” هستیم. همانطور که مشاهده میکنید، هر دو فناوری هوش مصنوعی تصاویر دقیقی را بر اساس دستور یادشده تولید کردهاند؛ هرچند که این دو تصویر از نظر ساختاری با یکدیگر تفاوت دارند.
دو تصویر بعدی، توانایی میدجرنی در تولید تصاویر وافعی را به خوبی نشان میدهد. از این رو اگر به دنبال ساخت تصاویر واقعی هستید، میدجرنی گزینهی مناسبتری برای شما خواهد بود. در طرف دیگر، استیبل دیفیوژن تمامی نکات موجود در دستور متنی را رعایت کرده اما از نظر کیفیت با تصویر تولیدشده توسط میدجرنی فاصلهی زیادی دارد.
در بخش زیر نیز میتوانید تفاوت میدجرنی و استیبل دیفیوژن در ساخت تصاویر فانتزی را مشاهده کنید. همانطور که در تصاویر مشاهده میکنید، میدجرنی در این بخش نیز نسبت به استیبل دیفیوژن عملکرد بهتری را از خود به جا گذاشته اما در قسمت پایینی تصویر تولیدشده از آن چندین حروف بیمعنی به چشم میخورد که ظاهراً تلاش نافرجام این هوش مصنوعی برای اضافهکردن واترمارک به تصویر بوده است.
توجه داشته باشید که کاربران حرفهای استیبل دیفیوژن میتوانند تصاویر بسیار باکیفیتتری را نسبت به نمونههای بالا تولید کنند اما اگر فاکتور سهولت استفاده را در نظر بگیریم، میدجرنی نسبت به استیبل دیفیوژن در رتبهی بالاتری قرار میگیرد.
نظرات