Фахівці у сфері штучного інтелекту американської корпорації Apple та Корнельського університету США непомітно для громадськості виклали у вільний доступ велику мультимодальну мовну модель з відкритим вихідним кодом.
Нейросеть отримала назву Ferret. У процесі своєї роботи вона користується частинами зображень як запити.
За інформацією видання VentureBeat, корпорація Apple представила свою нейромережу Ferret на GitHub ще в жовтні 2023 року, але про цю подію не було жодних офіційних новин з боку розробника. Тому реліз пройшов максимально потай від громадськості. Це помітили лише деякі дослідники, внаслідок чого інтерес фахівців до Ferret став поступово зростати.
За словами Барта Де Вітта, керуючого некомерційною організацією, що займається ІІ з відкритим вихідним кодом у медицині, випуск Ferret з боку Apple дозволить зміцнити позицію компанії як одного зі світових лідерів у сфері мультимодального штучного інтелекту.
Експерти наголошують, що принцип роботи нейромережі Ferret полягає в тому, що модель проводить аналіз вибраного фрагмента зображення, встановлює об’єкти в цій зоні та виділяє їх рамкою. Виявлені на фрагменті об’єкти нейромережа розглядає як частину запитів, куди надаються текстові відповіді.
Наприклад, користувачі можуть виділити на фотографії зображення тварин і попросити нейромережа розпізнати їх. Після обробки запиту технологія Ferret дасть текстову відповідь про те, до якого виду належать конкретні тварини, а потім користувач матиме можливість поставити додаткові питання, уточнити відомості про інші об’єкти на фотографії та дії в контексті.
За словами фахівця підрозділу Apple AI Чже Гана, нейромережева модель Ferret з відкритим вихідним кодом є системою, яка має можливість посилатися і обґрунтовувати будь-що, де завгодно і з різним ступенем деталізації.
Фахівці у сфері штучного інтелекту відзначають, що випуск нейромережі Ferret корпорацією Apple на GitHub є досить важливою подією, яка наочно показує дивовижний рівень відкритості американської компанії, що безпосередньо контрастує з її традиційним потайним характером.
Ситуацію трохи прояснив відомий американський технічний блогер Бен Діксон, який каже, що наразі ІТ-інфраструктура американської корпорації Apple зовсім не підходить для обслуговування великих мовних моделей у таких серйозних масштабах. У зв’язку з цим можна вже зараз говорити, що корпорація Apple навряд чи конкуруватиме з такими популярними моделями, як ChatGPT.
Саме тому розробники Apple вже обрали між партнерством із великими гравцями ринку у сфері створення нової технології штучного інтелекту та простою публікацією своєї розробки з відкритим вихідним кодом на GitHub.