У Meta було створено чотири спеціалізовані підрозділи для аналізу нової технології штучного інтелекту від китайського стартапу DeepSeek.
Що ще відомо
Розробка DeepSeek, чат-бот R1, має потенціал для серйозної конкуренції з Meta на ринку ШІ, демонструючи високу ефективність за значно нижчі витрати порівняно з аналогами, такими як ChatGPT. Стартап отримує підтримку від хедж-фонду High-Flyer Capital Management.
Метью Олдхем, директор з інфраструктури Meta AI, висловив стурбованість, що модель DeepSeek може перевершити нову версію розробки Meta — Llama, яка планується до релізу на початку 2025 року.
Два з чотирьох спеціальних підрозділів, створених Марком Цукербергом, займаються дослідженням методів зниження витрат на навчання та роботу DeepSeek, розроблених High-Flyer, і намагаються адаптувати ці підходи для оптимізації Llama. Інші дві команди зосереджені на аналізі наборів даних, які використовувалися для навчання DeepSeek, та адаптації архітектури Llama з урахуванням специфіки китайської моделі. Відкритий вихідний код DeepSeek змушує Meta переглянути свою стратегію розвитку ШІ та інвестицій у цій сфері.