اخبار تکنولوژی، انتخاب سردبیر، هوش مصنوعی

هوش مصنوعی Gemini 2.0 گوگل معرفی شد

22 آذر 1403 ساعت 10:14

گوگل از Gemini 2.0 Flash رونمایی کرده است؛ مدلی پیشرفته که علاوه بر تولید متون نوشتاری، قادر به ایجاد تصاویر و صدا به صورت بومی است. این مدل همچنین می‌تواند با اپلیکیشن‌ها و سرویس‌های شخص ثالث تعامل کند و به این ترتیب، به جستجوی گوگل دسترسی داشته باشد، کدهای برنامه‌نویسی را اجرا کند و قابلیت‌های گسترده‌تری را ارائه دهد.

نسخه آزمایشی ۲.۰ Flash از همین امروز از طریق API Gemini و پلتفرم‌های توسعه‌دهندگان هوش مصنوعی گوگل، AI Studio و Vertex AI در دسترس توسعه‌دهندگان قرار خواهد گرفت. با این حال، قابلیت‌های تولید صدا و تصویر در ابتدا تنها برای گروه محدودی از شرکای منتخب فعال خواهد بود و عرضه گسترده آن از ماه ژانویه آغاز می‌شود.

گوگل اعلام کرده است که در ماه‌های آینده، ۲.۰ Flash را در طیف وسیعی از محصولات خود مانند Android Studio، Chrome DevTools، Firebase، Gemini Code Assist و سایر محصولات یکپارچه خواهد کرد.

نسل قبلی Flash، یعنی ۱.۵ Flash، تنها قادر به تولید متن بود و برای انجام وظایف بسیار پیچیده طراحی نشده بود. گوگل ادعا می‌کند که این مدل جدید بسیار انعطاف‌پذیرتر است و بخشی از این انعطاف‌پذیری به دلیل توانایی آن در فراخوانی ابزارهایی مانند موتور جستجو و تعامل با APIهای خارجی است.

کلمه Gemini در زبان لاتین به معنای دوقلو است و در علم نجوم به صورت‌ فلکی جوزا اشاره دارد. جوزا در فارسی به معنای دو پیکر است و در اصل اشاره به اسطورهای یونانی کاستور و پلوکس دارد.

گوگل چند ماه پیش اعلام کرد که دو تیم تحقیقاتی Brain Team و DeepMind خود را برای ایجاد یک واحد جدید به نام Google DeepMind تجمیع کرده است. وظیفه این واحد توسعه مدل هوش مصنوعی نسل بعدی گوگل یعنی Gemini بود که این شرکت آن را سه نسخه مختلف معرفی کرد.

گوگل گفته است که Gemini را به‌صورت چندوجهی طراحی کرده است که آن را قادر به انجام کارهای پیشرفته می‌کند.

هوش مصنوعی Gemini در سه سایز مختلف ارائه شده تا نیازهای مختلف را پوشش دهد. قوی‌ترین نسخه Gemini Ultra نام دارد که برای انجام کارهای پیچیده طراحی شده است. مدل بعدی Gemini Pro نام دارد که برای استفاده در طیف وسیعی از دستگاه‌ها طراحی شده است. نسخه Gemini Nano نیز کارآمدترین مدل برای انجام کارهای روی دستگاه است.