Нещодавнє дослідження шести інженерів Apple виявило слабкі сторони просунутих ШІ-моделей, включаючи ChatGPT-4 від OpenAI, у виконанні надійних математичних міркувань. Дослідження показує, що зміни в структурі завдань, які здаються незначними — наприклад, заміна імен або чисел — можуть призвести до значних зниження продуктивності ШІ, з падінням точності від 0,3% до 9,2%.
Дослідження доповнює попередні висновки, які передбачають, що великі мовні моделі (LLM) використовують ймовірнісне зіставлення шаблонів, а чи не формальні логічні міркування вирішення завдань. При додаванні несуттєвої інформації, наприклад, деталей про розмір фруктів у задачі з математики, моделі ШІ зазнавали катастрофічних падінь точності, в деяких випадках до 65,7%.
Експерти вважають, що подальший прогрес ШІ вимагатиме розробки моделей, здатних обробляти абстрактні символічні операції, подібні до традиційної алгебри.
Щорічно різні видання публікують списки найкращих, проривних та найвпливовіших відеоігор. Цього разу до цього процесу…
Підвищення імпортних мит в США за часів президентства Дональда Трампа було спрямоване на кілька цілей,…
Майкрософт рекомендує користувачам здати старі ПК з Windows 10 в обмін або утилізувати їх після…
Інсайдер розкрив точну дату презентації Galaxy S25 Edge — нового ультратонкого флагмана Samsung із спрощеною…
Motorola готується презентувати оновлену серію складних смартфонів Razr, реліз яких запланований на квітень 2025 року.…
Нова версія ШІ-моделі GPT-4.5 від OpenAI успішно пройшла класичний тест Тьюринга, переваживши в більшості випадків…