Я достаточно часто пишу и обсуждаю с коллегами про то, как использовать нейросети с пользой — для работы, бизнеса и жизни. И почти в каждом втором обсуждении кто-то пишет что-то вроде: «Да что вы от него хотите, это же просто болтающий калькулятор. Просто много рассуждает, врет и думать не умеет».
Конечно, есть тут частичка правды. Особенно страдает качество, если применять «ИИ» к задачам «на логику».
Вот, например, посмотрим как «ИИ» справляются с задачкой из 5 класса мат. школы. Я ее использую её как мини-тест, когда выходит новая модель, чтобы проверить рекламные обещания:
см. Задачу 14 (Кстати, можете попробовать ее решить. Я лично пока нашел 2 способа. )
Я загонял ее в разные модели — от GPT до Grok и Gemini. Они начинают бодро рассуждать, но потом, почти всегда, произносят магическую фразу:
«Взвесим кучу A и кучу B. Если они равны, значит фальшивые монеты в куче C нет.»
И это, конечно, ошибка.
Потому что фальшивки могут быть и в куче C — обе сразу.