PalM 2 چیست؟ با مدل زبانی بزرگ گوگل آشنا شوید

افشین نوری
۲۷ خرداد ۱۴۰۲ - 12:00
گوگل پالم چیست؟

گوگل یکی از اولین شرکت‌هایی بود که به هوش مصنوعی مولد روی آورد و برای رقابت با رقبایی مانند ChatGPT و Bing Chat چت ربات اختصاصی خودش را با نام Bard عرضه کرد. این شرکت همچنین شروع به تست قابلیت نمایش پاسخ‌های هوش مصنوعی در کنار نتایج جستجو کرده است.

اما گوگل در حال انجام کارهای مهمتری نیز در زمینه هوش مصنوعی است و می‌خواهد مدل‌های یادگیری ماشین خود را توسعه بدهد. شما احتمالا چند سال پیش درباره مدل Google LaMDA شنیده‌اید، اما گوگل هم‌اکنون از مدل پیشرفته‌تر PalM 2 در محصولات هوش مصنوعی خود استفاده می‌کند.

ما در اینجا قصد داریم نگاهی دقیق‌تر به PalM 2 و تفاوت‌های آن با مدل‌های قبلی گوگل بیندازیم. ما سپس آن را با GPT-4 به عنوان بهترین مدل زبانی موجود مقایسه خواهیم کرد.

PalM 2 چیست و چگونه کار می‌کند؟

PalM مخفف Pathways Language Model است که به معنای استفاده از هوش مصنوعی Pathways گوگل برای کمک به آموزش مدل‌های یادگیری ماشین است. این مدل در واقع بخشی از برنامه بزرگ گوگل برای دستیابی به هوش مصنوعی عمومی یا AGI است.

PalM 2

گوگل گفته است که مدل Pathways می‌تواند هوش مصنوعی چندوجهی فراتر از متن ارائه کند. به گفته‌ی این شرکت:

Pathways می‌تواند راهکارهای چندوجهی را که شامل درک بینایی، شنوایی و زبان می‌شوند به طور همزمان فعال کند. بنابراین، این پلتفرم می‌تواند به‌طور همزمان کلمه “پلنگ” یا صدای کسی که می‌گوید “پلنگ” یا ویدئویی از دویدن “پلنگ” را نشان می‌دهد پردازش کند و به مفهوم “پلنگ” برسد. به همین‌خاطر، این مدل مستعد اشتباهات کمتری است.

گوگل برای اولین بار در سال ۲۰۲۲ در مورد PalM صحبت کرد. آن موقع گوگل هنوز محصولی با استفاده از این مدل عرضه نکرده بود. اما حالا با شدت گرفتن رقابت‌ در زمینه هوش مصنوعی، این شرکت چت بات Bard را به مدل PalM 2 ارتقا داده است. این مدل برخلاف مدل LaMDA که جایگزین آن شده است، به بیش از ۱۰۰ زبان زنده دنیا آموزش دیده است و حتی در زمینه‌هایی مثل کدنویسی، استدلال منطقی و محاسبات ریاضی عملکرد بسیار بهتری دارد.

مدل یادگیری ماشین LaMDA گوگل در مجموع دارای ۱۳۷ میلیارد پارامتر و ۱.۵۶ تریلیون کلمه است، در حالیکه PalM 2 از روش جدیدی به نام Compute-optimal scaling بهره می‌برد که منجر به نتایج بهتری با پارامترهای کمتر و داده‌های آموزشی کوچکتر می‌شود.

گوگل هنوز درباره ارائه قابلیت‌های چندوجهی برای محصولات هوش مصنوعی خود مثل Bard قولی نداده است. اما احتمالا مدل زبانی Gemini از فرمت‌های ترکیبی تصویر، صدا، ویدیو و موارد دیگر پشتیبانی خواهد کرد.

PalM 2 در برابر PalM و LaMDA

مدل PaLM 2 توانسته قابلیت‌های بیشتری به Bard اضافه کند. این چت بات هنگامی که برای اولین بار در اوایل سال ۲۰۲۳ با مدل زبانی LaMDA معرفی شد قابلیت‌های چندان زیادی نداشت، اما حالا با انتقال به PalM 2، بسیار پیشرفته شده است.

PalM 2

گوگل با انتشار یک گزارش ۹۲ صفحه‌ای، نحوه بهبود PalM 2 را نسبت به مد‌ل‌های قبلی آن توضیح داده است. ما در ادامه به‌طور خلاصه نگاهی به بهبودهای این مدل نسبت به مدل‌های قبلی انداخته‌ایم:

  1. PalM 2 بر پایه ترکیبی از زبان‌ها آموزش یافته است و داده‌های آموزشی آن شامل متون غیر انگلیسی زیادی می‌شود. این مدل همچنین عملکرد بهتری در تست‌های زبان خارجی نسبت به LaMDA و نسل اول PalM دارد.
  2. PalM 2 توانایی استدلال منطقی بهتری نسبت به مدل‌های قبلی خود دارد و حتی در برخی تست‌ها توانسته با GPT-4 رقابت کند.
  3. چت ربات Bard اکنون با بهره‌گیری از مدل PalM 2 قادر است کد بنویسد و از آنها اشکال‌زدایی کند. مدل‌های قبلی گوگل چنین قابلیتی نداشتند.
  4. PalM 2 می‌تواند ترجمه‌های بهتری نسبت به مدل‌های قبلی ارائه کند. حتی می‌توان گفت که در برخی زبان‌های خاص مثل پرتغالی و چینی عملکرد بهتری از Google Translate دارد.
  5. پلتفرم Pathways با بهره‌گیری از مدل زبانی جدید PaLM 2 کارآمدتر شده است. این ویژگی باعث شده تا استفاده از آن در سرویس‌های مختلف گوگل مثل جیمیل مقرون به صرفه‌تر باشد.
  6. گوگل قادر است PalM 2 را برای موارد استفاده خاص تنظیم کند. مثلا مدل Sec-PaLM قادر به تشخیص باگ‌های امنیتی است یا مدل Med-PaLM قابلیت پاسخ‌ به پرسش‌های پزشکی را دارد.

چگونه PalM 2 گوگل با GPT LLM‌ شرکت OpenAI قابل مقایسه است؟

OpenAI به عنوان خالق ChatGPT توانسته قابلیت‌های بیشتری نسبت به سایر مدل‌های زبانی ارائه کند. اما سوال اینجاست که آیا گوگل با معرفی PalM 2 موفق به ربودن گوی سبقت از این شرکت خواهد شد؟ طبق گزارش فنی گوگل، PalM 2 در تست‌های مختلف عملکرد بهتری داشته است. اما باید توجه داشت که تست‌های آزمایشگاهی لزوما به معنای عملکرد بهتر در دنیای واقعی نیست.

به همین‌خاطر، ما برای اینکه بدانیم کدامیک از آن‌ها عملکرد واقعا بهتری دارند از چت‌بات‌های Bard و Bing دو معما پرسیدیم. همانطور که می‌دانید مایکروسافت از مدل زبانی GPT-4 شرکت OpenAI در چت بات بینگ استفاده می‌کند. 

نتیجه اولین معمایی که پرسیدیم اینگونه شد. همانطور که در اسکرین‌شات‌ها می‌بینید PalM 2 و GPT-4 هر دو توانستند معما را به درستی حل کنند. PalM 2 حتی یک راه حل جایگزین به ما داد که GPT-4 چنین کاری را نکرد.

با این‌حال، چت بات Bard گوگل از حل معمای دیگر خودداری کرد، اما Bing Chat راه حل دقیقی برای آن ارائه داد. هرچند این دو نمونه نمی‌تواند تمام قابلیت‌های PalM 2 را تست کند، اما نشان می‌دهد که گوگل هنوز کار بیشتری برای انجام دارد.

گوگل چگونه از PalM 2 استفاده خواهد کرد؟

گوگل در کنفرانس توسعه دهندگان I/O 2023 خود توضیحاتی درباره آینده PalM 2 و پیشرفت‌های هوش مصنوعی داد. این مدل زبانی علاوه بر قابلیت‌هایی که بدان‌ها اشاره شد خواهد توانست کارهای دیگری، از قابلیت جدید Help me Write در گوگل داکز و جیمیل گرفته تا تولید تصاویر با هوش مصنوعی در اسلایدها را بهبود ببخشد. این بهبودها تحت عنوان Duet AI برای ورک‌اسپیس گوگل در ماه‌های آینده ارائه خواهند شد.

PalM 2

گوگل همچنین روی نسخه‌ای از PalM 2 برای استفاده در گوشی‌های هوشمند کار می‌کند. این مدل هم‌اکنون با نام رمز Gecko در حال توسعه است و روزی امکان استفاده از هوش مصنوعی مولد را به‌طور آفلاین در گوشی‌ها هوشمند فراهم خواهد کرد.

همچنین توسعه‌دهندگان اپلیکیشن اکنون می‌توانند جهت کارهای برنامه‌نویسی خود از طریق API به  PalM 2 دسترسی داشته باشند. این به معنای آن است که سایر شرکت‌ها ممکن است از مدل زبانی بزرگ گوگل در محصولات خود استفاده کنند.

سوالات متداول

Google Palm 2 چیست؟

Google Palm 2 مدل زبان بزرگی است که چت بات هوش مصنوعی Bard و سایر سرویس‌های گوگل مثل جیمیل از آن بهره می‌برند.

آیا Med-PaLM 2 برای استفاده قابل دسترس است؟

گوگل هنوز Med-PaLM 2 را به‌طور عمومی عرضه نکرده است. ظاهرا ابتدا گروه کوچکی از تست‌کنندگان قابل‌اعتماد اجازه دسترسی به آن خواهند داشت. 

منبع: Androidauthority

مطالب مرتبط سایت

نظرات

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.