گوگل ImageFX را به عنوان یک ابزار مستقل تولید تصویر هوش مصنوعی معرفی کرده است. ImageFX از مدل Imagen 2 استفاده میکند که اخیرا در قابلیتهای هوش مصنوعی گوگل بارد نیز استفاده شده بود.
در حال حاضر پلتفرمهایی مانند Midjourney و Stable Diffusion وجود دارند که از دستورات متنی برای تولید تصاویر استفاده میکنند. گوگل نیز سعی کرده یک ابزار مستقل تولید تصویر هوش مصنوعی معرفی کند.
گوگل در هفتههای گذشته قابلیتهای جدید تولید تصویر هوش مصنوعی را برای پلتفرم بارد معرفی کرده است، حالا این شرکت ImageFX را معرفی کرده است که قادر است با یک پیام متنی تصاویر هوش مصنوعی تولید کند.
نکته مهم درباره این ابزار آن است که تصاویر تولید شده با ImageFX، با واترمارک SynthID علامتگذاری میشوند و همچنین شامل ابرداده IPTC هستند که اطلاعات بیشتری درباره تصاویر به کاربران نشان میدهد.
ImageFX قدرت خود را از مدل Imagen 2 میگیرد که به نوبه خود از آخرین پیشرفتهای تبدیل متن به تصویر Google DeepMind بهره میبرد.
گوگل همچنین در حال ارتقا پلتفرم هوش مصنوعی MusicFX است که با بهبودهایی صورت گرفته در مدل MusicLM میتواند صدای با کیفیتتری تولید کند.
ImageFX و MusicFX بخشی از تلاشهای هوش مصنوعی گوگل هستند و کاربران در ایالات متحده، کنیا، نیوزلند و استرالیا میتوانند آنها را به زبان انگلیسی امتحان کنند.
گوگل همچنین چند ماه پیش اعلام کرد که دو تیم تحقیقاتی Brain Team و DeepMind خود را برای ایجاد یک واحد جدید به نام Google DeepMind تجمیع کرده است. وظیفه این واحد توسعه مدل هوش مصنوعی نسل بعدی گوگل یعنی Gemini بود که به تازگی سه نسخه مختلف معرفی شد.
گوگل گفته است که Gemini را بهصورت چندوجهی طراحی کرده است که آن را قادر به انجام کارهای پیشرفته میکند.
هوش مصنوعی Gemini در سه سایز مختلف ارائه شده تا نیازهای مختلف را پوشش دهد. قویترین نسخه Gemini Ultra نام دارد که برای انجام کارهای پیچیده طراحی شده است. مدل بعدی Gemini Pro نام دارد که برای استفاده در طیف وسیعی از دستگاهها طراحی شده است. نسخه Gemini Nano نیز کارآمدترین مدل برای انجام کارهای روی دستگاه است.
نظرات