Компанія OpenAI, творець ChatGPT, представила нове покоління голосових моделей для перетворення тексту в мовлення та навпаки. У компанії підкреслюють, що ці моделі побудовані на основі найсучасніших алгоритмів машинного навчання.
Система дозволяє не просто озвучувати текст, а й детально налаштовувати голос: можна змінювати інтонацію, тембр, емоційне забарвлення та стиль подачі. Наприклад, штучний інтелект може говорити голосом пірата чи оповідача казок. Крім готових шаблонів, користувачі можуть задавати власні інструкції для ще більш точного налаштування.
Також OpenAI покращила свою технологію розпізнавання мовлення. Нові моделі gpt-4o-transcribe та gpt-4o-mini-transcribe демонструють вищу точність перетворення мовлення в текст, навіть за складних умов — при сильному акценті, фонового шуму або різній швидкості мовлення.
Мета розробки — зробити взаємодію зі штучним інтелектом максимально природною та схожою на живе спілкування. Оновлені голосові моделі легко інтегруються у додатки та сервіси.
Нові можливості вже доступні для розробників через API, а всі охочі можуть випробувати їх на спеціальній демонстраційній платформі.
Нещодавно Google офіційно представила довгоочікуваний смартфон Pixel 9a — більш доступну версію флагманського Pixel 9…
Сьогодні аналітик Apple з питань ланцюга постачання Мінг-Чі Куо підтвердив, що процесори A20 для iPhone…
Як і більшість інших технологічних компаній, Google активно інвестує в розробку ШІ-моделей і намагається впроваджувати…
Портал Wccftech, посилаючись на інсайдера Vhsss_God, оприлюднив нові подробиці про майбутній флагман Samsung Galaxy S26…
Windows 10 досі залишається однією з найнадійніших операційних систем, і багато користувачів не поспішають переходити…
Компанія AMD знаходиться на фінальній стадії підготовки до випуску нової моделі відеокарти - Radeon RX…