DeepSeek випустив оновлені моделі AI V3

Китайський стартап DeepSeek представив значне оновлення своєї мовної моделі V3. DeepSeek-V3-0324 тепер доступний на платформі Hugging Face.

Ця оновлена версія нейронної мережі може похвалитися покращеними можливостями аргументації, програмування та запису. Він перевершує свого попередника та конкуруючі рішення в кількох тестах.

У січні DeepSeek став ключовим гравцем у секторі ШІ. У той час компанія запустила DeepSeek-R1, модель, орієнтовану на міркування з відкритим кодом, розроблену зі значно меншим бюджетом.

Модель V3, яка має 671 мільярд параметрів, була представлена в грудні 2024 року.

Генеральний директор китайського стартапу 01.AI Лі Кай-фу стверджує, що Китай скоротив розрив у розвитку штучного інтелекту зі США лише до трьох місяців, оскільки такі фірми, як DeepSeek, навчилися використовувати чіпи та ефективніше застосовувати алгоритми.

Він зазначив, що країна вже взяла лідерство в розробці програмного забезпечення для інфраструктури.

«Раніше я вважав, що розрив становив шість-дев’ять місяців, і ми відставали майже в кожному аспекті. Тепер, я думаю, ми відстаємо, можливо, на три місяці в деяких фундаментальних технологіях, але випереджаємо в інших конкретних сферах», — заявив Кай-фу.

За словами експерта, санкції США створили короткострокові виклики, але також змусили китайські компанії впроваджувати інновації.

Варто зазначити, що після стрімкого зростання популярності моделей DeepSeek AI компанія привернула увагу китайської влади, що призвело до того, що співробітники працюють на нових, більш суворих умовах.

Раніше OpenAI порадив уряду США заборонити рішення китайського конкурента, оскільки проект «субсидується державою» і «під його контролем».

Джерело: cryptocurrency.tech

No votes yet.

Please wait...