اخیراً شایعاتی مبنی بر ادغام دستیار هوش مصنوعی جمینای لایو با مرورگر کروم قوت گرفته است. این گمانهزنیها پس از آن مطرح شد که یکی از کاربران شبکه اجتماعی ایکس، دکمهای ناشناخته با عنوان GLIC را در کد منبع کرومیوم شناسایی کرد.
به نظر میرسد که کلیک بر روی این دکمه، پنجرهای با تنظیمات خاص، به ویژه دسترسی به میکروفون دستگاه را فعال میکند. این کشف، احتمال ارائه جمینای لایو به عنوان یک قابلیت مستقل در مرورگر کروم را تقویت کرده و گامی مهم در جهت یکپارچهسازی بیشتر هوش مصنوعی در تجربهی وبگردی محسوب میشود.
گوگل با معرفی جمینای لایو ، گامی بلند در جهت شخصیسازی و بهبود تجربه کاربری برداشته است. این دستیار هوش مصنوعی پیشرفته، امکان برقراری مکالمات طبیعی و دو طرفه را فراهم آورده و به کاربران اجازه میدهد تا با استفاده از طیف گستردهای از صداها، به صورت صوتی با آن تعامل داشته باشند. قابلیت اجرای Gemini Live در پسزمینه و روی صفحه قفل گوشیهای هوشمند، دسترسی کاربران را به این دستیار هوشمند تسهیل نموده است.
شواهدی مبنی بر وجود جمینای لایو در کد پروژه کرومیوم به دست آمده است. این امر نشان میدهد که گوگل در حال یکپارچهسازی این فناوری با سایر محصولات خود است. گرچه مخفف GLIC ممکن است به جمینای لایو در مرورگر کروم اشاره داشته باشد، اما تایید رسمی این موضوع هنوز صورت نگرفته است.
گوگل اخیرا از Gemini 2.0 Flash رونمایی کرده است؛ مدلی پیشرفته که علاوه بر تولید متون نوشتاری، قادر به ایجاد تصاویر و صدا به صورت بومی است. این مدل همچنین میتواند با اپلیکیشنها و سرویسهای شخص ثالث تعامل کند و به این ترتیب، به جستجوی گوگل دسترسی داشته باشد، کدهای برنامهنویسی را اجرا کند و قابلیتهای گستردهتری را ارائه دهد.
نسخه آزمایشی ۲.۰ Flash از همین امروز از طریق API Gemini و پلتفرمهای توسعهدهندگان هوش مصنوعی گوگل، AI Studio و Vertex AI در دسترس توسعهدهندگان قرار خواهد گرفت. با این حال، قابلیتهای تولید صدا و تصویر در ابتدا تنها برای گروه محدودی از شرکای منتخب فعال خواهد بود و عرضه گسترده آن از ماه ژانویه آغاز میشود.
دیدگاه ها