گوگل از Gemini 2.0 Flash رونمایی کرده است؛ مدلی پیشرفته که علاوه بر تولید متون نوشتاری، قادر به ایجاد تصاویر و صدا به صورت بومی است. این مدل همچنین میتواند با اپلیکیشنها و سرویسهای شخص ثالث تعامل کند و به این ترتیب، به جستجوی گوگل دسترسی داشته باشد، کدهای برنامهنویسی را اجرا کند و قابلیتهای گستردهتری را ارائه دهد.
نسخه آزمایشی ۲.۰ Flash از همین امروز از طریق API Gemini و پلتفرمهای توسعهدهندگان هوش مصنوعی گوگل، AI Studio و Vertex AI در دسترس توسعهدهندگان قرار خواهد گرفت. با این حال، قابلیتهای تولید صدا و تصویر در ابتدا تنها برای گروه محدودی از شرکای منتخب فعال خواهد بود و عرضه گسترده آن از ماه ژانویه آغاز میشود.
گوگل اعلام کرده است که در ماههای آینده، ۲.۰ Flash را در طیف وسیعی از محصولات خود مانند Android Studio، Chrome DevTools، Firebase، Gemini Code Assist و سایر محصولات یکپارچه خواهد کرد.
نسل قبلی Flash، یعنی ۱.۵ Flash، تنها قادر به تولید متن بود و برای انجام وظایف بسیار پیچیده طراحی نشده بود. گوگل ادعا میکند که این مدل جدید بسیار انعطافپذیرتر است و بخشی از این انعطافپذیری به دلیل توانایی آن در فراخوانی ابزارهایی مانند موتور جستجو و تعامل با APIهای خارجی است.
کلمه Gemini در زبان لاتین به معنای دوقلو است و در علم نجوم به صورت فلکی جوزا اشاره دارد. جوزا در فارسی به معنای دو پیکر است و در اصل اشاره به اسطورهای یونانی کاستور و پلوکس دارد.
گوگل چند ماه پیش اعلام کرد که دو تیم تحقیقاتی Brain Team و DeepMind خود را برای ایجاد یک واحد جدید به نام Google DeepMind تجمیع کرده است. وظیفه این واحد توسعه مدل هوش مصنوعی نسل بعدی گوگل یعنی Gemini بود که این شرکت آن را سه نسخه مختلف معرفی کرد.
گوگل گفته است که Gemini را بهصورت چندوجهی طراحی کرده است که آن را قادر به انجام کارهای پیشرفته میکند.
هوش مصنوعی Gemini در سه سایز مختلف ارائه شده تا نیازهای مختلف را پوشش دهد. قویترین نسخه Gemini Ultra نام دارد که برای انجام کارهای پیچیده طراحی شده است. مدل بعدی Gemini Pro نام دارد که برای استفاده در طیف وسیعی از دستگاهها طراحی شده است. نسخه Gemini Nano نیز کارآمدترین مدل برای انجام کارهای روی دستگاه است.
نظرات