OpenAI презентувала новітні інструменти для розпізнавання мови та синтезу голосу

Час читання: < 1 хв.

OpenAI представила нові моделі штучного інтелекту для створення голосу та розпізнавання мови. Вони набагато кращі за попередні версії та є частиною планів компанії зі створення “агентів” — розумних систем, які можуть виконувати завдання замість користувача.

Глава відділу продуктів OpenAI Олів’є Годемон розповів, що такі системи незабаром з’являться у багатьох сферах, і компанія хоче допомогти розробникам створювати зручні та точні інструменти.

Серед новинок — модель для генерації голосу gpt-4o-mini-tts, яка звучить більш природно. Розробники можуть задавати стиль голосу, наприклад, “говорити як божевільний вчений” або “спокійно, як учитель медитації”.

Інший співробітник OpenAI, Джефф Харріс, пояснив, що розробники можуть керувати не тільки тим, що говорить модель, а й тоном і емоціями. Наприклад, у службі підтримки голос може звучати ввічливо та співчутливо.

Також OpenAI представила нові моделі для транскрипції — “gpt-4o-transcribe” та “gpt-4o-mini-transcribe”. Вони замінять стару систему Whisper та краще справляються з акцентами та шумом. Крім того, вони рідше вигадують слова.

Проте точність транскрипції залежить від мови. Наприклад, для мов тамільська, телугу, малаялам та каннада рівень помилок все ще досить високий — приблизно 30%.

На відміну від Whisper, нові моделі не будуть у відкритому доступі, оскільки потребують багато ресурсів і не підходять для роботи на звичайних пристроях.

Нові можливості вже доступні через OpenAI API.

ЗАРАЗ ЧИТАЮТЬ

Названо дату анонсу нового чіпа Qualcomm

Qualcomm представила Snapdragon G3 Gen 3 для революції у світі портативних ігрових ПК.

Apple розробляє модульні Apple Watch із безперервним моніторингом здоров’я

Microsoft випадково видалила Copilot в оновленні Windows 11 від 11 березня 2025 року

Google представила відкриті ШІ-моделі, що змінять підхід до розробки ліків

Новий модем Apple C1 перевершив Qualcomm Snapdragon X71 у ключових тестах

Samsung планує відмовитись від 1.4-нм технології виробництва чіпів

Apple впевнена в успіху редизайну iOS та macOS

Розкрито ціну першого складаного iPhone

Apple звинуватили в обмані через затримку запуску Apple Intelligence

Вас також можуть зацікавити новини:

Huawei представила нові навушники в унікальному дизайні

Sony готує революцію у сфері мобільної фотографії

Не пропустіть

Як Google заощадила на Pixel 9a і чим він поступається Pixel...

Наступне покоління iPhone отримає 2-нм чіпи

Google впроваджує Gemini AI прямо у браузер Chrome

Флагман Samsung Galaxy S26 Ultra отримає нові камери, акумулятор та стілус

Свіже оновлення Windows 10 може зламати ваш комп’ютер

ASUS готує до випуску нові відеокарти Radeon RX 9606 з різним...

СВІЖІ НОВИНИ

Як Google заощадила на Pixel 9a і чим він поступається Pixel 9

Наступне покоління iPhone отримає 2-нм чіпи

Google впроваджує Gemini AI прямо у браузер Chrome

Флагман Samsung Galaxy S26 Ultra отримає нові камери, акумулятор та стілус

Свіже оновлення Windows 10 може зламати ваш комп’ютер

ASUS готує до випуску нові відеокарти Radeon RX 9606 з різним об’ємом пам’яті

NVIDIA розкриває ціни на нову лінійку професійних відеокарт RTX Pro Blackwell

DisplayPort та HDMI: який стандарт більше підходить геймерам

Експерт розповів про основні недоліки надяскравих дисплеїв у смартфонах

ChatGPT помилково назвав чоловіка винним у масовому вбивстві