گوگل هوش مصنوعی ImageFX را برای تولید تصاویر جذاب معرفی کرد

13 بهمن 1402 ساعت 10:34

گوگل ImageFX را به عنوان یک ابزار مستقل تولید تصویر هوش مصنوعی معرفی کرده است. ImageFX از مدل Imagen 2 استفاده می‌کند که اخیرا در قابلیت‌های هوش مصنوعی گوگل بارد نیز استفاده شده بود.

در حال حاضر پلتفرم‌هایی مانند Midjourney و Stable Diffusion وجود دارند که از دستورات متنی برای تولید تصاویر استفاده می‌کنند. گوگل نیز سعی کرده یک ابزار مستقل تولید تصویر هوش مصنوعی معرفی کند.

گوگل در هفته‌های گذشته قابلیت‌های جدید تولید تصویر هوش مصنوعی را برای پلتفرم بارد معرفی کرده است، حالا این شرکت ImageFX را معرفی کرده است که قادر است با یک پیام متنی تصاویر هوش مصنوعی تولید کند.

نکته مهم درباره این ابزار آن است که تصاویر تولید شده با ImageFX، با واترمارک SynthID علامت‌گذاری می‌شوند و همچنین شامل ابرداده IPTC هستند که اطلاعات بیشتری درباره تصاویر به کاربران نشان می‌دهد.

ImageFX قدرت خود را از مدل Imagen 2 میگیرد که به نوبه خود از آخرین پیشرفت‌های تبدیل متن به تصویر Google DeepMind بهره می‌برد.

گوگل همچنین در حال ارتقا پلتفرم هوش مصنوعی MusicFX است که با بهبودهایی صورت گرفته در مدل MusicLM می‌تواند صدای با کیفیت‌تری تولید کند.

ImageFX و MusicFX بخشی از تلاش‌های هوش مصنوعی گوگل هستند و کاربران در ایالات متحده، کنیا، نیوزلند و استرالیا می‌توانند آن‌ها را به زبان انگلیسی امتحان کنند.

گوگل همچنین چند ماه پیش اعلام کرد که دو تیم تحقیقاتی Brain Team و DeepMind خود را برای ایجاد یک واحد جدید به نام Google DeepMind تجمیع کرده است. وظیفه این واحد توسعه مدل هوش مصنوعی نسل بعدی گوگل یعنی Gemini بود که به تازگی سه نسخه مختلف معرفی شد.

گوگل گفته است که Gemini را به‌صورت چندوجهی طراحی کرده است که آن را قادر به انجام کارهای پیشرفته می‌کند.

هوش مصنوعی Gemini در سه سایز مختلف ارائه شده تا نیازهای مختلف را پوشش دهد. قوی‌ترین نسخه Gemini Ultra نام دارد که برای انجام کارهای پیچیده طراحی شده است. مدل بعدی Gemini Pro نام دارد که برای استفاده در طیف وسیعی از دستگاه‌ها طراحی شده است. نسخه Gemini Nano نیز کارآمدترین مدل برای انجام کارهای روی دستگاه است.