Експерти Каліфорнійського університету в Берклі заявили про розробку нової технології RoVi-Aug, що дає змогу роботам в автономному режимі навчатися навичок один в одного. Створена технологія ґрунтується на навчанні моделі виявленню і використанню причинно-наслідкових зв’язків між діями робота і виконуваними завданнями.
Що ще відомо
У процесі функціонування система створює синтетичні дані, які адаптуються до різних типів роботизованої техніки і кутів огляду камер. Такий підхід знижує потребу в зборі реальних даних і спрощує процеси навчання роботів. Завдяки цьому алгоритму роботи можуть набагато швидше освоювати нові завдання і збільшують успішність їхнього виконання приблизно на 30%.
Одна з команд учених у рамках проекту Open-X Embodiment змогла об’єднати в загальну систему інформацію, зібрану з 60 роботів. Це було зроблено для того, щоб вони могли навчатися навичок один в одного. При цьому фахівці відзначають, що цей метод пов’язаний із серйозною проблемою: у зібраних даних міститься велика кількість інформації про конкретних роботів, а кути огляду камер обмежені. У результаті роботизована техніка запам’ятовує тільки обмежені дані і не може справлятися з новими завданнями, якщо як приклад показують дії роботів іншого типу або змінюють положення камери.
Також використовується інший алгоритм під назвою Mirage, який здатний адаптувати невідомих роботів із застосуванням так званого “перехресного забарвлення”. Це дає змогу зробити їх схожими на моделі з навчальної вибірки. Але ця технологія не підтримує тонкого налаштування, і зміна положення камери може збити алгоритм з пантелику.
У Каліфорнійському університеті розробили власний метод RoVi-Aug, який дає змогу подолати вищевказані обмеження. Розробники стверджують, що на відміну від стандартних підходів, які об’єднують дані з різних роботів, технологія RoVi-Aug фокусується на навчанні моделей розумінню взаємозв’язку між діями роботизованих пристроїв і виконуваними завданнями.
У процесі своєї роботи нова архітектура створює візуальні синтетичні демонстрації, які змінюються залежно від різновиду робота і кута огляду камери. Це збільшує рівень універсальності процедури навчання.
Сама технологія складається з двох основних компонентів. Перший компонент – це модуль доповнення даних про роботів, який називається Ro-Aug. З його допомогою формуються демонстрації з різними роботизованими системами. Другий – це модуль доповнення даних про точку зору (Vi-Aug), необхідний для імітації демонстрації з різних ракурсів камери.
Комбінація цих модулів створює максимально різноманітний датасет для навчання роботів, завдяки чому пристрої можуть тренуватися на величезній кількості сценаріїв.