متا بهتازگی مدل هوش مصنوعی جدید Code Llama را معرفی کرد، این مدل بر پایه مدل زبانی بزرگ Llama 2 ساخته شده و هدف آن کمک به برنامه نویسان برای تولید کد و اشکال زدایی از آن است. استفاده از این مدل کاملا رایگان است.
Code Llama همانند پلتفرمهایی مثل ChatGPT و GitHub Copilot Chat میتواند کدنویسی بکند. این مدل حتی میتواند از یک نمونه کد مشکلدار رفع اشکال کند. متا مدل Code Llama را بر پایه دادههای کد منبع آموزش داده است که میتواند از زبانهای مختلف برنامه نویسی مثل Python، Java، C++، PHP، TypeScript، C#، Bash scripting و پشتیبانی کند.
مدل Code Llama همچنین میتواند ۱۰۰ هزار توکن متنی را مدیریت کند. این در حالیست کهChatGPT فقط ۴۰۰۰ تا ۸۰۰۰ توکن را می تواند مدیریت کند. Code Llama در سه نسخه ۷، ۱۳ و ۳۴ میلیارد پارامتری ارائه شده است. این پارامترها در واقع اجزای عددی شبکه عصبی هستند که در طول پروسه آموزش تنظیم می شوند. هرچه تعداد پارامترها بیشتر باشد به معنای پیچیدگی بیشتر و قابلیتهای بهتراست و به قدرت محاسباتی بالاتری نیاز دارند.
متا همچنین دو نسخه تخصصی عرضه کرده است که شامل Code Llama – Python و Code Llama – Instruct می شود. نسخه Python، برای برنامه نویسی پایتون که یک زبان مهم در زمینه هوش مصنوعی است بهینهسازی شده است. نسخه Instruct نیز برای تفسیر بهتر نیت کاربر در صورت درخواست زبانهای طبیعی طراحی شده است.
متا همواره از رویکرد باز نسبت به فناوریهای هوش مصنوعی پشتیبانی کرده است و آنچه این شرکت ارائه می کند بسیار بازتر از فناوری OpenAI است که معمولا کدهای مدلهای پیشرفته خود را در دسترس عموم قرار نمیدهد.
- مطالب مرتبط:
- قوانین پیرامون هوش مصنوعی چگونه خواهند بود؟
- اطلاعاتی از هدست واقعیت گسترده سامسونگ و گوگل فاش شد
البته متا منبع دقیق دادههای آموزشی Code Llama را فاش نکرده است اما ظاهرا این دادهها از وبسایت StackOverflow استخراج شدهاند. بررسی عملکرد Code Llama توسط تستهای بنچمارک HumanEval نشان میدهد که نسخه تخصصی Python Code Llama امتیاز ۵۳.۷ درصد را بهدست آورده که بالاترین امتیاز در میان مدلهای مشابه است. اما در همان تستها مدل GPT-4 توانسته امتیاز ۶۷ درصد را کسب کند که نشان میدهد دارای پارامترهای بسیار بیشتری است.
مدلهای پایه Code Llama با تعداد پارامترهای 7B، 13B و 34B به ترتیب امتیازهای ۳۳.۵، ۳۶ و ۴۸.۸ درصد را در HumanEval کسب کردند. این امتیازها پایینتر از امتیاز GPT-4 هستند. نسخه Instruct نیز نتوانسته بهتر از GPT-4 عمل کند و نسخه Instruct 34B امتیاز ۴۱.۵ درصد را کسب کرده است.
شما برای استفاده از Code Llama نیاز به تجربه تخصصی در زمینه راهاندازی اینگونه نرمافزارها دارید، اما انتظار میرود که بهزودی اینترفیسهای کاربرپسندتری برای آن ارائه شوند. متا امیدوار است که با معرفی مدل Code Llama راه را برای توسعه پلتفرمهای تخصصیتر روی Llama 2 مهیا کند.
شما می توانید با پر کردن فرمی در وبسایت متا درخواست خود را برای دسترسی به Code Llama ارسال کنید.
منبع: Arstechnica
نظرات