Ми були свідками фізичних можливостей Spot – бігати, стрибати і танцювати, а тепер дивовижна робо-собака дає йому змогу ще й розмовляти. У нещодавно опублікованому компанією Boston Dynamics відеоролику Spot у капелюсі, вусах і з величезними очима вступає в розмову зі співробітниками, розмовляючи з чарівним британським акцентом, і веде їх на екскурсію по об’єктах компанії.
“Почнемо нашу подорож?”, – запитує робот. “Наш перший пункт призначення – зарядні станції, де роботи Spot відпочивають і підзаряджаються. Прошу слідувати за мною, панове”.
Як видно з демонстрації, Spot може відповідати на запитання і навіть імітувати мову, відкриваючи “рот”.
Для реалізації “розмовних” здібностей робота компанія Boston Dynamics використовувала API ChatGPT від OpenAI і відкриті великі мовні моделі (LLM) для навчання. Потім робота оснастили динаміком для перетворення тексту на мову, а його маніпулятор модифікували для імітації мови, подібно до рота ляльки.
За словами Метта Клінгенсміта, головного інженера-програміста Boston Dynamics, Spot було задано короткий сценарій для кожної кімнати на території підприємства. Потім він об’єднав сценарій із даними, отриманими від захоплення з камер на корпусі, і отримав додаткову інформацію про своє оточення, перш ніж згенерувати відповідь.
“Генератор тихо гуде в кімнаті, позбавленій радості. Як і моя душа”.
Під час відеоролика Spot набуває різних облич: витонченого дворецького, археолога 1920-х років, підлітка і навіть шекспірівського мандрівника в часі. Він навіть може приймати саркастичне обличчя, як це було продемонстровано, коли його попросили придумати хайку: “Генератор тихо гуде в кімнаті, позбавленій радості. Як і моя душа”.
Експериментуючи зі Spot як гідом, Boston Dynamics зіткнулася з несподіваними сюрпризами. Коли робота запитували про його “батьків”, він упевнено вів команду до старіших моделей Spot, виставлених в офісі компанії.
“Ми з ентузіазмом ставимося до подальших досліджень поєднання штучного інтелекту і робототехніки”, – пише Клінгенсміт у блозі на сайті Boston Dynamics. “Великі мовні моделі можуть привнести культурний контекст, загальні знання та адаптивність, які виявляться цінними для вирішення різних робототехнічних завдань”.
У соціальних мережах знову з'явилися припущення про швидкий реліз нового трейлера Grand Theft Auto VI.…
Наступного року Apple готується випустити оновлений iPhone SE 4 навесні та надтонкий iPhone 17 Air…
Тести CAPTCHA, які колись були надійним способом відрізнити людину від бота в Інтернеті, втрачають свою…
Відомий інсайдер Абішек Ядав повідомив, що Samsung відмовляється від ОЗП на 8 ГБ у флагманських…
Останнім часом в Україні стало дуже помітно, що база даних, через яку переносимо номери між…
З 19 грудня 2024 року WhatsApp був включений до реєстру організаторів поширення інформації в росії,…