Компанія DeepSeek анонсувала оновлену модель VL2, яка призначена для розпізнавання інформації на зображеннях, повідомляє VC. Оновлена серія DeepSeek-VL2 побудована на методі Mixture of Experts (MoE) та включає моделі DeepSeek-VL2-Tiny (1 млрд параметрів), VL2-Small (2,8 млрд параметрів) та VL2 (4,5 млрд параметрів).
Що відомо
Розробники стверджують, що VL2 перевершує попередню версію DeepSeek-VL і здатна розуміти та пояснювати зміст документів, таблиць та діаграм, пропонувати рецепти з фотографій продуктів, розпізнавати та друкувати текст.
Окрім іншого, нова модель здатна ідентифікувати об’єкти на зображеннях та знаходити аналогічні об’єкти на інших.
DeepSeek-VL2 вже доступна як безкоштовна демоверсія на платформі Hugging Face. Дата додавання нової моделі до чат-боту поки не повідомляється.