Boston Dynamics навчили робота Spot розмовляти

ЗАРАЗ ЧИТАЮТЬ

Час читання: 2 хв.

Ми були свідками фізичних можливостей Spot – бігати, стрибати і танцювати, а тепер дивовижна робо-собака дає йому змогу ще й розмовляти. У нещодавно опублікованому компанією Boston Dynamics відеоролику Spot у капелюсі, вусах і з величезними очима вступає в розмову зі співробітниками, розмовляючи з чарівним британським акцентом, і веде їх на екскурсію по об’єктах компанії.

Реклама

“Почнемо нашу подорож?”, – запитує робот. “Наш перший пункт призначення – зарядні станції, де роботи Spot відпочивають і підзаряджаються. Прошу слідувати за мною, панове”.

Як видно з демонстрації, Spot може відповідати на запитання і навіть імітувати мову, відкриваючи “рот”.

Для реалізації “розмовних” здібностей робота компанія Boston Dynamics використовувала API ChatGPT від OpenAI і відкриті великі мовні моделі (LLM) для навчання. Потім робота оснастили динаміком для перетворення тексту на мову, а його маніпулятор модифікували для імітації мови, подібно до рота ляльки.

За словами Метта Клінгенсміта, головного інженера-програміста Boston Dynamics, Spot було задано короткий сценарій для кожної кімнати на території підприємства. Потім він об’єднав сценарій із даними, отриманими від захоплення з камер на корпусі, і отримав додаткову інформацію про своє оточення, перш ніж згенерувати відповідь.

“Генератор тихо гуде в кімнаті, позбавленій радості. Як і моя душа”.

Під час відеоролика Spot набуває різних облич: витонченого дворецького, археолога 1920-х років, підлітка і навіть шекспірівського мандрівника в часі. Він навіть може приймати саркастичне обличчя, як це було продемонстровано, коли його попросили придумати хайку: “Генератор тихо гуде в кімнаті, позбавленій радості. Як і моя душа”.

Експериментуючи зі Spot як гідом, Boston Dynamics зіткнулася з несподіваними сюрпризами. Коли робота запитували про його “батьків”, він упевнено вів команду до старіших моделей Spot, виставлених в офісі компанії.

“Ми з ентузіазмом ставимося до подальших досліджень поєднання штучного інтелекту і робототехніки”, – пише Клінгенсміт у блозі на сайті Boston Dynamics. “Великі мовні моделі можуть привнести культурний контекст, загальні знання та адаптивність, які виявляться цінними для вирішення різних робототехнічних завдань”.

Реклама

Вас також можуть зацікавити новини:

Не пропустіть

СВІЖІ НОВИНИ