شرکت چینی علی‌بابا از نسخه جدید مدل هوش مصنوعی خود با نام Qwen2.5-Max پرده برداشت. این مدل با ارائه قابلیت‌های چشمگیر، پا را از رقبا فراتر گذاشته و حتی از DeepSeek-V3 پیشی گرفته است.

علی‌بابا در بیانیه‌ای اعلام کرد که مدل Qwen2.5-Max در آزمون‌های معتبری همچون Arena-Hard، LiveCodeBench و GPQA-Diamond، عملکردی به مراتب بهتر از DeepSeek V3 داشته است. در سایر آزمون‌ها نیز این مدل تقریبا هم‌سطح با DeepSeek ظاهر شده و در برخی موارد حتی از GPT-4o و Llama-3.1-405B نیز فراتر رفته است.

به نظر می‌رسد در دنیای هوش مصنوعی، شاهد تحولات جدیدی هستیم. مدل‌های جدیدی که توسط علی‌بابا و DeepSeek توسعه یافته‌اند، نشان می‌دهند که برای دستیابی به کارایی بالا، نیازی به سرمایه‌گذاری‌های هنگفت نیست. با بهینه‌سازی معماری هوش مصنوعی، می‌توان مدل‌هایی کم‌هزینه و در عین حال کارآمد ایجاد کرد.