شرکت چینی Kuaishou از مدل هوش مصنوعی Kling رونمایی کرده است که میتواند با دریافت دستورات متنی، ویدیوهای حداکثر دو دقیقهای با وضوح 1080p تولید کند.
این شرکت همچنین مالک یک اپلیکیشن اشتراکگذاری ویدیوهای کوتاه در چین نیز میباشد. آنطور که پیداست، هوش مصنوعی Kling مانند مدل هوش مصنوعی Sora که توسط شرکت OpenAI ساخته شده است، یک سرویس تبدیل متن به ویدیو میباشد. این نوآوری که اکنون در مرحله آزمایشی قرار دارد، نشاندهنده تلاش شرکتهای فناوری چینی برای پیشرفت در حوزه هوش مصنوعی و رقابت با شرکتهای آمریکایی است.
براساس گزارش یک خبرگزاری چینی، هوش مصنوعی Kling قادر است تا از طریق دریافت متن، ویدیوهای حداکثر دو دقیقهای با وضوح 1080p تولید کند. شرکت Kuaishou همچنین اعلام کرده است مدل آنها میتواند با پردازش درخواست کاربران، فیزیک دنیای واقعی را شبیهسازی کند و حتی با استفاده از دستورات متنی، صحنههای تخیلی خلق کند.
این مدل مانند هوش مصنوعی Sora برای تولید ویدیو از یک مدل مبدل انتشاری استفاده میکند؛ البته شرکت Kuaishou قبلا از یک مدل زبانی بزرگ نیز برای تولید تصویر از متن با نام KwaiYii رونمایی کرده است. شایان ذکر است که شرکتهای بزرگ فناوری پیشرفت قابل توجهی در زمینه توسعه مدلهای هوش مصنوعی با قابلیت تولید ویدیو از متن داشتهاند که قادر به خلق نتایج بسیار واقعگرایانه هستند.
انتظار میرود که هوش مصنوعی Kling با مدل هوش مصنوعی Sora که هنوز در دسترس عموم قرار نگرفته است، وارد رقابت شود. هوش مصنوعی Sora در فوریه سال ۲۰۲۴ معرفی شد و قادر است براساس درخواست کاربران، ویدیوهای حداکثر یک دقیقهای بسازد؛ البته شرکت OpenAI در آن زمان ادعا کرد که هوش مصنوعی Sora علاوهبر درک آنچه که کاربر درخواست میکند، فیزیک آن در دنیای واقعی را نیز تشخیص میدهد.
نظرات