Новини України та Світу

OpenAI презентувала новітні інструменти для розпізнавання мови та синтезу голосу

Share
Час читання: < 1 хв.

OpenAI представила нові моделі штучного інтелекту для створення голосу та розпізнавання мови. Вони набагато кращі за попередні версії та є частиною планів компанії зі створення “агентів” — розумних систем, які можуть виконувати завдання замість користувача.

Глава відділу продуктів OpenAI Олів’є Годемон розповів, що такі системи незабаром з’являться у багатьох сферах, і компанія хоче допомогти розробникам створювати зручні та точні інструменти.

Серед новинок — модель для генерації голосу gpt-4o-mini-tts, яка звучить більш природно. Розробники можуть задавати стиль голосу, наприклад, “говорити як божевільний вчений” або “спокійно, як учитель медитації”.

Інший співробітник OpenAI, Джефф Харріс, пояснив, що розробники можуть керувати не тільки тим, що говорить модель, а й тоном і емоціями. Наприклад, у службі підтримки голос може звучати ввічливо та співчутливо.

Також OpenAI представила нові моделі для транскрипції — “gpt-4o-transcribe” та “gpt-4o-mini-transcribe”. Вони замінять стару систему Whisper та краще справляються з акцентами та шумом. Крім того, вони рідше вигадують слова.

Проте точність транскрипції залежить від мови. Наприклад, для мов тамільська, телугу, малаялам та каннада рівень помилок все ще досить високий — приблизно 30%.

На відміну від Whisper, нові моделі не будуть у відкритому доступі, оскільки потребують багато ресурсів і не підходять для роботи на звичайних пристроях.

Нові можливості вже доступні через OpenAI API.

Лужна Софія

Глибокі знання та досвід Софії у сфері технічної підтримки зробили її надійним помічником у вирішенні проблем, а пристрасть до технологій спонукала її ділитися своїми знаннями з іншими за допомогою свого контенту. Як людина, яка щодня працює над усуненням проблем і навчає своїх користувачів користуватися всіма доступними інструментами, маючи лише обліковий запис Google, її висвітлення новин, як правило, зосереджене на наданні читачам більш зручної для користувача точки зору та деяких менш відомих цікавинок на цю тему.

Опублікував
Лужна Софія
Tags: OpenAI

Останні записи

OpenAI оголосила про перерозподіл керівних ролей у компанії

OpenAI оголосила про розширення обов'язків головного операційного директора Бреда Лайткепа та підвищення двох ключових менеджерів…

24.03.2025

Google Tensor G5 стане найбільшим оновленням у серії

Схоже, що Google нарешті вирішила серйозно взятися за свої процесори Tensor і зробити їх по-справжньому…

24.03.2025

SpaceX готує нову антену Starlink у 5 разів швидшу за нинішні моделі

Компанія SpaceX працює над створенням нової антени для Starlink, яка зможе передавати дані зі швидкістю…

24.03.2025

AirPods Max отримали ще одну важливу перевагу для покупців

Apple офіційно анонсувала, що нове оновлення для AirPods Max, яке буде випущене разом із iOS…

24.03.2025

iPhone 17 може отримати дисплей з частотою 120 Гц навіть у базовій версії

Про скупість Apple складають легенди, оскільки компанія не дає користувачам iPhone без приставки Pro безліч…

24.03.2025

DeepSeek запускає тренд на відкритий вихідний код у сфері штучного інтелекту

Китайські компанії на ринку ШІ, від великих, як Baidu, до менших, як Manus AI, все…

24.03.2025