Ми були свідками фізичних можливостей Spot – бігати, стрибати і танцювати, а тепер дивовижна робо-собака дає йому змогу ще й розмовляти. У нещодавно опублікованому компанією Boston Dynamics відеоролику Spot у капелюсі, вусах і з величезними очима вступає в розмову зі співробітниками, розмовляючи з чарівним британським акцентом, і веде їх на екскурсію по об’єктах компанії.
“Почнемо нашу подорож?”, – запитує робот. “Наш перший пункт призначення – зарядні станції, де роботи Spot відпочивають і підзаряджаються. Прошу слідувати за мною, панове”.
Як видно з демонстрації, Spot може відповідати на запитання і навіть імітувати мову, відкриваючи “рот”.
Для реалізації “розмовних” здібностей робота компанія Boston Dynamics використовувала API ChatGPT від OpenAI і відкриті великі мовні моделі (LLM) для навчання. Потім робота оснастили динаміком для перетворення тексту на мову, а його маніпулятор модифікували для імітації мови, подібно до рота ляльки.
За словами Метта Клінгенсміта, головного інженера-програміста Boston Dynamics, Spot було задано короткий сценарій для кожної кімнати на території підприємства. Потім він об’єднав сценарій із даними, отриманими від захоплення з камер на корпусі, і отримав додаткову інформацію про своє оточення, перш ніж згенерувати відповідь.
“Генератор тихо гуде в кімнаті, позбавленій радості. Як і моя душа”.
Під час відеоролика Spot набуває різних облич: витонченого дворецького, археолога 1920-х років, підлітка і навіть шекспірівського мандрівника в часі. Він навіть може приймати саркастичне обличчя, як це було продемонстровано, коли його попросили придумати хайку: “Генератор тихо гуде в кімнаті, позбавленій радості. Як і моя душа”.
Експериментуючи зі Spot як гідом, Boston Dynamics зіткнулася з несподіваними сюрпризами. Коли робота запитували про його “батьків”, він упевнено вів команду до старіших моделей Spot, виставлених в офісі компанії.
“Ми з ентузіазмом ставимося до подальших досліджень поєднання штучного інтелекту і робототехніки”, – пише Клінгенсміт у блозі на сайті Boston Dynamics. “Великі мовні моделі можуть привнести культурний контекст, загальні знання та адаптивність, які виявляться цінними для вирішення різних робототехнічних завдань”.
Samsung представить "слім" версію у своїй майбутній серії Galaxy S25, щоб конкурувати з ультратонким iPhone…
Ряди "вінтажних" і "застарілих" пристроїв Apple поповнили одразу кілька гаджетів. Що ще відомо Нагадаємо, що…
Пам'ятаєте ті часи, коли телефони могли працювати кілька днів без підзарядки? Це було реально, особливо…
Компанія Xiaomi анонсувала вихід нової операційної системи HyperOS 2, яка буде заснована на Android 15.…
Бездротові технології продовжують розвиватися. Хоча організація IEEE ще не затвердила стандарт Wi-Fi 7, уже ведеться…
Здавалося б, південнокорейського гіганта Samsung Electronics вже довго переслідують невдачі, і котирування його акцій з…