گوگل از Gemini 2.0 Flash رونمایی کرده است؛ مدلی پیشرفته که علاوه بر تولید متون نوشتاری، قادر به ایجاد تصاویر و صدا به صورت بومی است. این مدل همچنین میتواند با اپلیکیشنها و سرویسهای شخص ثالث تعامل کند و به این ترتیب، به جستجوی گوگل دسترسی داشته باشد، کدهای برنامهنویسی را اجرا کند و قابلیتهای گستردهتری را ارائه دهد.
نسخه آزمایشی ۲.۰ Flash از همین امروز از طریق API Gemini و پلتفرمهای توسعهدهندگان هوش مصنوعی گوگل، AI Studio و Vertex AI در دسترس توسعهدهندگان قرار خواهد گرفت. با این حال، قابلیتهای تولید صدا و تصویر در ابتدا تنها برای گروه محدودی از شرکای منتخب فعال خواهد بود و عرضه گسترده آن از ماه ژانویه آغاز میشود.
گوگل اعلام کرده است که در ماههای آینده، ۲.۰ Flash را در طیف وسیعی از محصولات خود مانند Android Studio، Chrome DevTools، Firebase، Gemini Code Assist و سایر محصولات یکپارچه خواهد کرد.
نسل قبلی Flash، یعنی ۱.۵ Flash، تنها قادر به تولید متن بود و برای انجام وظایف بسیار پیچیده طراحی نشده بود. گوگل ادعا میکند که این مدل جدید بسیار انعطافپذیرتر است و بخشی از این انعطافپذیری به دلیل توانایی آن در فراخوانی ابزارهایی مانند موتور جستجو و تعامل با APIهای خارجی است.
نظرات