Boston Dynamics навчили робота Spot розмовляти

ПРОДОВЖЕННЯ ПІСЛЯ РЕКЛАМИ

Ми були свідками фізичних можливостей Spot – бігати, стрибати і танцювати, а тепер дивовижна робо-собака дає йому змогу ще й розмовляти. У нещодавно опублікованому компанією Boston Dynamics відеоролику Spot у капелюсі, вусах і з величезними очима вступає в розмову зі співробітниками, розмовляючи з чарівним британським акцентом, і веде їх на екскурсію по об’єктах компанії.

“Почнемо нашу подорож?”, – запитує робот. “Наш перший пункт призначення – зарядні станції, де роботи Spot відпочивають і підзаряджаються. Прошу слідувати за мною, панове”.

Як видно з демонстрації, Spot може відповідати на запитання і навіть імітувати мову, відкриваючи “рот”.

ПРОДОВЖЕННЯ ПІСЛЯ РЕКЛАМИ

Для реалізації “розмовних” здібностей робота компанія Boston Dynamics використовувала API ChatGPT від OpenAI і відкриті великі мовні моделі (LLM) для навчання. Потім робота оснастили динаміком для перетворення тексту на мову, а його маніпулятор модифікували для імітації мови, подібно до рота ляльки.

За словами Метта Клінгенсміта, головного інженера-програміста Boston Dynamics, Spot було задано короткий сценарій для кожної кімнати на території підприємства. Потім він об’єднав сценарій із даними, отриманими від захоплення з камер на корпусі, і отримав додаткову інформацію про своє оточення, перш ніж згенерувати відповідь.

“Генератор тихо гуде в кімнаті, позбавленій радості. Як і моя душа”.

Під час відеоролика Spot набуває різних облич: витонченого дворецького, археолога 1920-х років, підлітка і навіть шекспірівського мандрівника в часі. Він навіть може приймати саркастичне обличчя, як це було продемонстровано, коли його попросили придумати хайку: “Генератор тихо гуде в кімнаті, позбавленій радості. Як і моя душа”.

Експериментуючи зі Spot як гідом, Boston Dynamics зіткнулася з несподіваними сюрпризами. Коли робота запитували про його “батьків”, він упевнено вів команду до старіших моделей Spot, виставлених в офісі компанії.

“Ми з ентузіазмом ставимося до подальших досліджень поєднання штучного інтелекту і робототехніки”, – пише Клінгенсміт у блозі на сайті Boston Dynamics. “Великі мовні моделі можуть привнести культурний контекст, загальні знання та адаптивність, які виявляться цінними для вирішення різних робототехнічних завдань”.

Якщо ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисніть Ctrl+Enter.