Штучний інтелект стрімко заповнює кожен куточок Чемпіонату світу з футболу 2026. Він вигадує новітні футбольні форми, збирає тисячі даних з поля, і навіть охороняє стадіони у вигляді роботів-собак, які, ймовірно, не піддаються спокусі ковбасою.
Проте, попри всю свою зайнятість, ШІ залишається наївним щодо одного, найважливішого показника: хто виграє, а хто програє.
У понеділок, який, мабуть, був днем з низькою активністю новин, спортивні журналісти USA Today запитали Copilot від Microsoft про матчі Чемпіонату світу того дня. Всього відбулося чотири поєдинки: Іспанія-Кабо-Верде, де Copilot прогнозував результат 3:0; Бельгія-Єгипет – 2:1; Уругвай-Саудівська Аравія – 2:1; та Іран-Нова Зеландія – 1:0.
Як і можна було очікувати, прогнози значно відхилилися від реальності. Насправді, кожен матч закінчився внічию – результат, який Copilot навіть не розглядав як можливий. Бельгія-Єгипет та Уругвай-Саудівська Аравія завершилися з рахунком 1:1, а Іран і Нова Зеландія розійшлися з рахунком 2:2. Мабуть, найбільш вражаючим спростуванням стало досягнення Кабо-Верде, чий нині вірусний воротар Жосімар («Возінья») Діас продемонстрував надзвичайну гру, утримавши топ-збірну Іспанії від голу – 0:0.
Прогнозувальний аналіз Copilot багато чого говорить. Як пишуть USA Today, ШІ-модель дійшла висновку, що атакуючі гравці Іспанії завдадуть стільки ударів по недостатньо ефективній обороні Кабо-Верде, що вона врешті-решт зламається, виявивши очевидно нерівний матч. Як показала Іспанія, цей прогноз, ймовірно, більше свідчить про роздутий медіа-ажіотаж, який поглинав Copilot, ніж про будь-який продуманий аналіз.
Варто зазначити, що ШІ від Microsoft – не єдиний, хто отримує червону картку. Раніше цього місяця журналісти попросили ChatGPT спрогнозувати результати фіналу НБА між Нью-Йорк Нікс та Сан-Антоніо Сперс. Хоча “Нікс” вражаюче перемогли в п’ятій грі на вихідних, ChatGPT спочатку назвав “Сперс” чемпіонами НБА 2026 року, заявивши, що суперзірка Сан-Антоніо Віктор Вембаньяма допоможе довести серію до сьомої гри.
Невдалі прогнози з’явилися після скандального попереднього дослідження, яке показало, що великі мовні моделі, такі як ChatGPT і Copilot, жахливо не готові прогнозувати результати спортивних подій або навіть аналізувати важливі моменти та ігри після їх завершення.
Під час одного з тестів здатності провідних ШІ-моделей прогнозувати результат різних ігрових сегментів тривалістю від трьох до 15 хвилин, навіть модель з найкращими показниками впоралася лише на 43 відсотки. Це вказує на значний розрив у здатності LLM прогнозувати реальні результати, навіть за суворо контрольованих умов футбольного матчу. Як написали дослідники: «люди досягають 58,9 відсотка загалом і залишаються добре відкаліброваними, на відміну від [ШІ] моделей».
Отже, стає зрозуміло, що LLM ще далекі від розуміння нюансів гри. Хоча це погана новина для тих, хто сподівається зробити ставки на Чемпіонаті світу, це ще гірше для технологічної індустрії, яка витратила сотні мільярдів доларів, намагаючись перетворити LLM на машини складного мислення.
Дізнатися більше на: futurism.com
