شرکت xAI، رقیب شرکت OpenAI که توسط ایلان ماسک تأسیس شده است، نسخه جدیدی از هوش مصنوعی Grok با نام Grok 1.5V معرفی کرده که میتواند اطلاعات بصری را پردازش کند.
نسخهی ۱.5V هوش مصنوعی Grok، اولین نسل از هوش مصنوعی چندوجهی این شرکت است که نه تنها میتواند ورودی متن را پردازش کند، بلکه میتواند اسناد، نمودارها، اسکرینشاتها و عکسها را نیز پردازش کند.
شرکت xAI در هنگام معرفی نسخهی جدید Grok، به توضیح چند نمونه از کاربردهای آن در دنیای واقعی پرداخت. به عنوان مثال، شما میتوانید عکسی از یک فلوچارت را به هوش مصنوعی Grok نشان دهید و از آن بخواهید تا فلوچارت را برای شما به کد پایتون ترجمه کند، میتوانید از این هوش مصنوعی بخواهید تا داستانی بر اساس نقاشی شما بنویسد و یا حتی از آن بخواهید تا مفهوم یک تصویر را برای شما توضیح دهد.
نسخهی جدید هوش مصنوعی Grok تنها چند هفته پس از رونمایی این شرکت از نسخهی ۱.۵ آن ارائه میشود. نسخهی جدید به گونهای طراحی شده است تا در کدنویسی و ریاضی بهتر از مدل قبلی عمل کند؛ همچنین بتواند مکالمات طولانیتری را پردازش کند تا بتواند دادهها را از منابع بیشتری برای درک بهتر سؤالات خاص بررسی کند.
به گفتهی شرکت xAI، کاربران فعلی این هوش مصنوعی و همچنین آزمایشکنندگان اولیه آن، به زودی میتوانند از قابلیتهای نسخه ۱.5V هوش مصنوعی Grok بهرهمند شوند. اگرچه این شرکت زمان دقیقی برای عرضهی نسخهی جدید آن ارائه نکرده است.
علاوه بر معرفی نسخهی جدید هوش مصنوعی Grok، این شرکت مجموعهی RealWorldQA، متشکل از ۷۰۰ تصویر را جهت ارزیابی مدل های هوش مصنوعی منتشر کرده است. شما میتوانید از هریک از این ۷۰۰ تصویر برای بررسی و ارزیابی مدلهای هوش مصنوعی استفاده کنید؛ هر تصویر شامل سؤالات و پاسخهایی است که شما میتوانید به راحتی آنها را تأیید کنید، اما ممکن است مدلهای چندوجهی مانند Grok را دچار مشکل کند و آن را به چالش بکشد.
شرکت xAI ادعا میکند زمانی که با استفاده از معیار RealWorldQA هوش مصنوعی Grok را در برابر رقبای خود مانند هوش مصنوعی GPT-4V شرکت OpenAi و هوش مصنوعی Gemini Pro 1.5 شرکت گوگل مورد آزمایش قرار داده است، این هوش مصنوعی توانسته بالاترین امتیاز را دریافت کند و بهتر از رقبای خود ظاهر شود.
نظرات