Блог им. Zashibis |Задача из 5 класса, которая ломает ChatGPT и ему подобных

Я достаточно часто пишу и обсуждаю с коллегами про то, как использовать нейросети с пользой — для работы, бизнеса и жизни. И почти в каждом втором обсуждении кто-то пишет что-то вроде: «Да что вы от него хотите, это же просто болтающий калькулятор. Просто много рассуждает, врет и думать не умеет».

Конечно, есть тут частичка правды. Особенно страдает качество, если применять «ИИ» к задачам «на логику». 
Вот, например, посмотрим как «ИИ» справляются с задачкой из 5 класса мат. школы.  Я ее использую её как мини-тест, когда выходит новая модель, чтобы проверить рекламные обещания:


см. Задачу 14 (Кстати, можете попробовать ее решить. Я лично пока нашел 2 способа. )
Задача из 5 класса, которая ломает ChatGPT и ему подобных

Я загонял ее в разные модели — от GPT до Grok и Gemini. Они начинают бодро рассуждать, но потом, почти всегда, произносят магическую фразу:

«Взвесим кучу A и кучу B. Если они равны, значит фальшивые монеты в куче C нет.»

И это, конечно, ошибка.
Потому что фальшивки могут быть и в куче C — обе сразу.



( Читать дальше )

....все тэги
UPDONW
Новый дизайн