اخیراً شایعاتی مبنی بر ادغام دستیار هوش مصنوعی جمینای لایو با مرورگر کروم قوت گرفته است. این گمانه‌زنی‌ها پس از آن مطرح شد که یکی از کاربران شبکه اجتماعی ایکس، دکمه‌ای ناشناخته با عنوان GLIC را در کد منبع کرومیوم شناسایی کرد.

به نظر می‌رسد که کلیک بر روی این دکمه، پنجره‌ای با تنظیمات خاص، به ویژه دسترسی به میکروفون دستگاه را فعال می‌کند. این کشف، احتمال ارائه جمینای لایو به عنوان یک قابلیت مستقل در مرورگر کروم را تقویت کرده و گامی مهم در جهت یکپارچه‌سازی بیشتر هوش مصنوعی در تجربه‌ی وب‌گردی محسوب می‌شود.

گوگل با معرفی جمینای لایو ، گامی بلند در جهت شخصی‌سازی و بهبود تجربه کاربری برداشته است. این دستیار هوش مصنوعی پیشرفته، امکان برقراری مکالمات طبیعی و دو طرفه را فراهم آورده و به کاربران اجازه می‌دهد تا با استفاده از طیف گسترده‌ای از صداها، به صورت صوتی با آن تعامل داشته باشند. قابلیت اجرای Gemini Live در پس‌زمینه و روی صفحه قفل گوشی‌های هوشمند، دسترسی کاربران را به این دستیار هوشمند تسهیل نموده است.

شواهدی مبنی بر وجود جمینای لایو در کد پروژه کرومیوم به دست آمده است. این امر نشان می‌دهد که گوگل در حال یکپارچه‌سازی این فناوری با سایر محصولات خود است. گرچه مخفف GLIC ممکن است به جمینای لایو در مرورگر کروم اشاره داشته باشد، اما تایید رسمی این موضوع هنوز صورت نگرفته است.

گوگل اخیرا از Gemini 2.0 Flash رونمایی کرده است؛ مدلی پیشرفته که علاوه بر تولید متون نوشتاری، قادر به ایجاد تصاویر و صدا به صورت بومی است. این مدل همچنین می‌تواند با اپلیکیشن‌ها و سرویس‌های شخص ثالث تعامل کند و به این ترتیب، به جستجوی گوگل دسترسی داشته باشد، کدهای برنامه‌نویسی را اجرا کند و قابلیت‌های گسترده‌تری را ارائه دهد.

نسخه آزمایشی ۲.۰ Flash از همین امروز از طریق API Gemini و پلتفرم‌های توسعه‌دهندگان هوش مصنوعی گوگل، AI Studio و Vertex AI در دسترس توسعه‌دهندگان قرار خواهد گرفت. با این حال، قابلیت‌های تولید صدا و تصویر در ابتدا تنها برای گروه محدودی از شرکای منتخب فعال خواهد بود و عرضه گسترده آن از ماه ژانویه آغاز می‌شود.