گوگل دیروز اعلام کرد که مدل DeepMind رکورد جدیدی در زمینه هوش مصنوعی ثبت کرده است: سیستم هوش مصنوعی جدید این شرکت، AlphaGeometry2، برای اولین بار در یک آزمون گسترده از مسائل هندسه در المپیاد جهانی ریاضی (IMO)، از مدال‌آوران طلای انسان فراتر رفت.

یک تیم تحقیقاتی، ۴۵ مسئله هندسه از مسابقات IMO بین سال‌های ۲۰۰۰ تا ۲۰۲۴ را انتخاب کرد و آن‌ها را به ۵۰ مسئله استاندارد تبدیل نمود. نتایج نشان داد که AlphaGeometry2 توانست ۴۲ مسئله را با موفقیت حل کند و از میانگین امتیاز مدال‌آوران طلا که ۴۰.۹ بود، پیشی بگیرد.

دستاورد DeepMind از اهمیت زیادی برخوردار است. به گفته تیم تحقیقاتی، توانایی استدلال و انتخاب راهبردی که برای حل مسائل چالش‌برانگیز هندسه، به‌ویژه هندسه اقلیدسی لازم است، می‌تواند عنصری کلیدی در ساخت نسل بعدی هوش مصنوعی عمومی باشد.

AlphaGeometry2 مدلی فراتر از مدال‌آوران طلا

رکوردشکنی هوش مصنوعی DeepMind در المپیاد ریاضی - تکفارس

DeepMind به این مسابقه ریاضی دبیرستانی توجه ویژه‌ای دارد، زیرا حل مسائل هندسه اقلیدسی ممکن است یکی از کلیدهای توسعه سیستم‌های هوش مصنوعی قدرتمندتر باشد. اثبات مسائل ریاضی نیازمند قدرت استدلال و توانایی انتخاب از میان مسیرهای مختلف حل مسئله است. این مهارت‌ها می‌توانند بخش مهمی از مدل‌های هوش مصنوعی عمومی آینده را تشکیل دهند.

در فرایند حل مسئله، مدل Gemini گوگل وظیفه پیش‌بینی ساختارهای هندسی مورد نیاز را بر عهده دارد (مانند اضافه کردن نقاط کمکی، خطوط یا دایره‌ها)، درحالی‌که موتور نمادین محاسبات را بر اساس قوانین ریاضی دقیق انجام می‌دهد. این دو ماژول با کمک الگوریتم‌های جستجوی موازی همکاری می‌کنند و اطلاعات به‌دست‌آمده را در یک دیتابیس مشترک ذخیره می‌نمایند. زمانی که سیستم بتواند پیشنهادات مدل جمنای را با اصول موتور نمادین ترکیب کند و به یک اثبات کامل برسد، آن مسئله حل‌شده تلقی می‌شود.

math

برای رفع چالش کمبود داده‌های آموزشی هندسی، تیم تحقیقاتی بیش از ۳۰۰ میلیون مسئله و اثبات با پیچیدگی‌های مختلف را به‌طور مستقل تولید کرد. این روش آموزش الگویی جدید برای پیشرفت‌های هوش مصنوعی در حوزه‌های تخصصی ارائه می‌دهد.

قابلیت‌های AlphaGeometry2 همچنان محدودیت‌هایی دارد. این سیستم نمی‌تواند مسائلی را که شامل تعداد متغیر نقاط، معادلات غیرخطی و نامساوی‌ها هستند، حل کند. در میان ۲۹ مسئله سخت‌تر که به‌طور خاص توسط تیم تحقیقاتی انتخاب شده بودند، این سیستم توانست تنها ۲۰ مورد را حل کند.

معمولا، دو رویکرد اصلی در هوش مصنوعی وجود دارد: روش‌های مبتنی بر عملیات نمادین (که دانش را از طریق قوانین ازپیش‌تعریف‌شده نمایش می‌دهند) و روش‌های مبتنی بر شبکه‌های عصبی که شبیه به مغز انسان عمل می‌کنند.

AlphaGeometry2 از یک معماری ترکیبی بهره می‌برد. طبق مقاله DeepMind، مدل o1 شرکت OpenAI که فقط از شبکه عصبی استفاده می‌کند، نتوانست هیچ‌ یک از مسائلی را که AlphaGeometry2 حل کرده بود، پاسخ دهد. وینس کونیتزر، کارشناس هوش مصنوعی اظهار داشت:

«درحالی‌که این مدل‌ها پیشرفت شگفت‌انگیزی در این معیارها دارند، حتی جدیدترین مدل‌های زبانی که برای استدلال طراحی شده‌اند، هنوز در برخی سؤالات ساده‌ مربوط به منطق عمومی مشکل دارند. این صرفاً یک پیشرفت سطحی نیست، بلکه نشان می‌دهد که هنوز نمی‌توانیم رفتار نسل بعدی این سیستم‌ها را با دقت پیش‌بینی کنیم. با توجه به تأثیرات عظیمی که این سیستم‌ها خواهند داشت، ما به درک بهتر آن‌ها و خطرات احتمالی‌شان نیاز فوری داریم.»

با این‌ حال، تا زمانی که سرعت محاسبات این مدل به‌ طور اساسی بهبود نیابد و مشکل گمراه کردن آن کاملاً برطرف نشود، ابزارهای کمکی مانند موتورهای محاسبات نمادین همچنان نقش مهمی در کاربردهای ریاضی خواهند داشت.