دیپ‌سیک یک استارتاپ چینی است که با انتشار مدل‌های هوش مصنوعی خود مورد توجه جهانیان قرار گرفته است. در مقاله امروز این هوش مصنوعی را به طور کامل معرفی می‌کنیم.

استارتاپ هوش مصنوعی چینی دیپ‌سیک (DeepSeek) پس از صدرنشینی اپلیکیشن چت بات این شرکت در اپ استور اپل و همچنین گوگل پلی، در کانون توجهات جهانیان قرار گرفته است. مدل‌های هوش مصنوعی این استارتاپ که با استفاده از تکنیک‌های محاسباتی کارآمد و کم هزینه آموزش داده شده‌اند، تحلیل‌گران وال استریت را انگشت به دهن کرده و آن‌ها را به این فکر فرو برده است که آیا ایالات متحده پیشتازی خود درعرصه هوش مصنوعی را از دست خواهد داد و اینکه آیا تقاضا برای تراشه‌های هوش مصنوعی این کشور ادامه خواهد داشت یا خیر.

سر و کله‌ی دیپ‌سیک از کجا پیدا شد و چگونه به این سرعت به شهرت جهانی دست یافت؟

دیپ سیک توسط صندوق سرمایه گذاری کوانتومی چینی به نام High-Flyer Capital Management پشتیبانی می‌شود. لیانگ ون‌فنگ، کارشناس حوزه هوش مصنوعی صندوق سرمایه گذاری High-Flyer را در سال ۲۰۱۵ تأسیس کرد. ون‌فنگ  که ظاهراً در دوران دانشجویی در دانشگاه ژجیانگ کار تجارت را آغاز کرده بود، صندوق High-Flyer Capital Management را به عنوان صندوق تامینی در سال ۲۰۱۹ با تمرکز بر توسعه و استقرار الگوریتم‌های هوش مصنوعی راه‌اندازی کرد.

در سال ۲۰۲۳، High-Flyer دیپ سیک را به عنوان آزمایشگاه تحقیقاتی ابزارهای هوش مصنوعی جدا از تجارت بنا نهاد. سپس این آزمایشگاه به شرکتی به نام دیپ سیک تبدیل شد و High Flyer به عنوان یکی از سهامداران آن فعایت کرد. از روز اول، دیپ‌سیک اقدام به ایجاد خوشه‌های مرکز داده به منظور آموزش مدل‌های هوش مصنوعی اختصاصی خود کرد. البته این شرکت کار راحتی در پیش نداشت. دیپ سیک مانند سایر شرکت‌های هوش مصنوعی در چین، با تحریم‌های صادرات سخت افزار ایالات متحده روبرو بود. این شرکت مجبور شد از تراشه‌های H800 انویدیا که نسخه ضعیف‌تر تراشه H100 است، برای آموزش یکی از مدل‌های جدید خود استفاده کند.

هوش مصنوعی دیپ‌سیک

گفته می‌شود تیم فنی دیپ سیک از افراد جوان تشکیل شده است. بنا به گزارشات این شرکت محققان هوش مصنوعی در مقطع دکترای دانشگاه‌های برتر چینی را به خدمت می‌گیرد. به نوشته نیویورک تایمز، دیپ‌سیک همچنین افراد بدون سابقه در زمینه علوم رایانه را به استخدام در می‌آورد تا به فناوری خود کمک کند تا به فهم بهتری از طیف گسترده‌ای از موضوعات دست یابد.

مدل‌های قدرتمند دیپ‌سیک

دیپ‌سیک از اولین مدل‌های هوش مصنوعی خود با نام DeepSeek Coder، DeepSeek LLM و DeepSeek Chat در نوامبر ۲۰۲۳ رونمایی کرد. همزمان با انتشار نسل بعدی مدل‌های DeepSeek-V2 صنعت هوش مصنوعی مورد توجه قرار گرفت. DeepSeek-V2، یک سیستم تجزیه و تحلیل متن و تصویر چند منظوره است که در چندین بنچمارک هوش مصنوعی عملکرد خوبی از خود نشان داده. استفاده و اجرای این مدل نسبت به مدل‌های مشابه آن زمان بسیار کم هزینه‌تر بود. این امر رقبای داخلی دیپ‌سیک از جمله بایت دنس و علی‌بابا را مجبور کرد تا قیمت‌های استفاده از برخی از مدل‌های خود را کاهش داده و برخی دیگر را کاملاً رایگان کنند.

در دسامبر ۲۰۲۴ مدل DeepSeek-V3 منتشر شد که باعث دو چندان شدن شهرت دیپ‌سیک شد. DeepSeek V3 در تست‌های داخلی توانست از مدل‌های قابل دانلود و در دسترس مانند Llama و مدل‌های بسته که فقط از طریق API قابل دسترسی هستند، مانند GPT-4o شرکت OpenAI بهتر عمل ‌کند. پس از آن در ژانویه ۲۰۲۵ شاهد انتشار مدل استدلالی R1 بودیم. این مدل نیز به اندازه مدل قبلی عملکرد چشمگیری داشت. دیپ سیک ادعا می‌کند R1 در بنچمارک‌های کلیدی عملکردی هم سطح مدل o1 شرکت OpenAI دارد.

R1 به عنوان مدل استدلال، به طور موثر خود را صحت سنجی می‌کند. این کار که به آن کمک می کند تا از برخی از مشکلاتی که معمولاً مدل ها را به خطر می اندازند اجتناب کند. مدل‌های استدلالی در مقایسه با مدل‌های غیر استدلالی معمولی کمی بیشتر طول می‌کشد تا به راه‌حل‌ها برسند. نکته مثبت این است که آنها در حوزه هایی مانند فیزیک، علوم و ریاضیات قابل اعتمادتر هستند.

با این حال، مدل‌های R1، DeepSeek V3 و سایر مدل‌های دیپ‌سیک یک ایراد بزرگ داشت. از آنجایی که این مدل‌های هوش مصنوعی در چین توسعه یافته‌اند، تحت نظازت نهادهای نظارتی چین قرار می‌گیرند تا اطمینان حاصل شود پاسخ‌های ارائه شده با موازین سوسیالیستی این کشور مغایرتی نداشته باشد. به عنوان مثال، در اپلیکیشن چت بات دیپ سیک، R1 به سوالات مربوط به استقلال تایوان پاسخ نمی‌دهد.

هوش مصنوعی دیپ‌سیک

علاوه بر این، رویکرد مخربی که دیپ‌سیک در پیش گرفته این است که این شرکت محصولات و خدمات خود را با قیمت بسیار پایین‌تر از بازار در دسترس کاربران قرار می‌دهد. و برخی خدمات دیگر را حتی به صورت رایگان ارائه می‌دهد. بنا به اعلام دیپ‌سیک، پیشرفت های بهره وری این شرکت را قادر ساخته است تا در بخش هزینه رقابت با رقبا را حفظ کنند. برخی از صاحب نظران با آمار و ارقام ارائه شده توسط این شرکت را قبول ندارند.

در هر صورت، مدل‌های هوش مصنوعی دیپ‌سیک توجه توسعه‌دهندگان را به خود جلب کرده و آن‌ها را به سوی خود کشانده است. این مدل‌ها به اصطلاح امروزی منبع باز نیستند، اما تحت لایسنس‌های انعطاف پذیر امکان استفاده تجاری را فراهم می‌کنند. کلم دلانگ، مدیرعامل Hugging Face، یکی از پلتفرم‌های میزبان مدل‌های دیپ‌سیک، در این باره گفته است که توسعه‌دهندگان در Hugging Face بیش از ۵۰۰ مدل مشتق‌شده از R1 را ایجاد کرده‌اند که مجموعاً ۲.۵ میلیون بار دانلود شده است. موفقیت دیپ‌سیک در برابر رقبای بزرگ به حدی چشمگیر بوده است که باعث ریزش ۱۸ درصدی قیمت سهام انویدیا در روز دوشنبه هفته قبل شده است.

هوش مصنوعی دیپ‌سیک

مایکروسافت نیز اعلام کرده است دیپ‌سیک در سرویس Azure AI Foundry این شرکت که خدمات هوش مصنوعی را برای شرکت‌ها تحت یک بنر واحد گرد هم می‌آورد، در دسترس قرار دارد. مارک زاکربرگ مدیرعامل مایکروسافت در جریان گزارش درآمد سه ماهه شرکت در پاسخ به سوالی در مورد تأثیر هوش مصنوعی دیپ‌سیک بر مخارج هوش مصنوعی متا گفت که هزینه زیرساخت‌های هوش مصنوعی همچنان یک “مزیت استراتژیک” برای متا محسب می‌شود.

البته برخی از شرکت‌ها، و دولتمردان دسترسی کاربران به دیپ‌سیک را مسدود کرده‌اند. هنوز آینده دیپ‌سیک مشخص نیست. اما آنچه مسلم است انتظار می‌رود شاهد انتشار مدل‌های ارتقا یافته دیپ‌سیک باشیم. البته نباید از آمریکا غافل شد. این کشور دیپ‌سیک را عامل خارجی مضر می‌داند و با دقت آن را زیر نظر دارد.