Новини України та Світу

NVIDIA випустила суперника для GPT-4 у сфері штучного інтелекту

Share
Час читання: < 1 хв.

Компанія NVIDIA розповіла про свою нову мультимодальну модель на 72 млрд параметрів, яка може працювати з текстом і картинками. Розробники розповіли, чим вона може бути цікава, і повідомили, що скоро опублікують модель у відкритому доступі.

Докладніше

Модель називається NVLM-D-72B і входить до сімейства NVLM. У документації до нього компанія прямо згадує як суперників відкриті мовні моделі на зразок Llama 3-V 405B і закриті, як GPT-4o. Також наводяться тести нейромережі, де вона обійшла GPT-4o у бенчмарку на розпізнавання тексту OCRBench та Llama 3-V70B у тесті на розуміння природних зображень VQAv2.

Порівняння з іншими моделями
Приклади запитів

Як приклад компанія наводить кілька тестових запитів до нейромережі. Наприклад, можна показати дорожні знаки багатосмугової дороги і запитати, якою смугою їхати, або дати рукописну замітку з псевдокодом і попросити перевести його в програмний код. Також нейромережа може пояснити мем на малюнку або вирішити рівняння.

У NVIDIA також планують опублікувати вихідний код NVLM та позиціонують модель як основу, яку надалі зможуть використовувати сторонні розробники у своїх програмах. Дізнатися технічні подробиці можна у документації до моделі .

Скарбик Павло

Закінчив Тернопільський національний технічний університет, почав писати про IT у 2015 році. Люблю розповідати про iPhone і Mac, автомобілі, їжу, гаджети розумного будинку і роблю огляди. Також захоплююся спортом а саме баскетболом і активним відпочинком на свіжому повітрі. Головний редактор iTechua.com.

Опублікував
Скарбик Павло
  • Останні записи

    Pixel Buds Pro 2 можуть додати функцію Auracast для спільного прослуховування аудіо

    Сьогодні з'явилася інформація про те, що в майбутньому оновленні для Pixel Buds Pro 2 може…

    03.10.2024

    Microsoft оголосила, що Edge скоро стане дуже швидким браузером

    Компанія підтвердила, що впроваджує в налаштування Edge архітектуру WebUI 2.0, що має призвести до значного…

    03.10.2024

    Штучний інтелект може взяти на себе обов’язки секретарів, бухгалтерів і перекладачів

    Автоматизація рутинних завдань значно знижує витрати компаній та підвищує їх ефективність. Сучасні технології суттєво полегшують…

    03.10.2024

    Android 16 вийде набагато раніше звичайного терміну

    Поки ми всі чекаємо на офіційний реліз Android 15, компанія Google розглядає можливість випуску наступного…

    03.10.2024

    Вчені з Китаю створили матеріал, який усуває причину займання акумуляторів

    Корейські вчені розробили інноваційний матеріал відомий як Safety Reinforced Layer (SRL). Він усуває основну причину…

    03.10.2024

    Що таке глобальна версія смартфона і що вона означає

    Одні й самі моделі смартфонів можуть відрізнятися маркуванням Global, CN яка багатьом незрозуміла. Ми ж…

    03.10.2024