Сергей Попов
Сергей Попов личный блог
20 июня 2025, 14:54

Задача из 5 класса, которая ломает ChatGPT и ему подобных

Я достаточно часто пишу и обсуждаю с коллегами про то, как использовать нейросети с пользой — для работы, бизнеса и жизни. И почти в каждом втором обсуждении кто-то пишет что-то вроде: «Да что вы от него хотите, это же просто болтающий калькулятор. Просто много рассуждает, врет и думать не умеет».

Конечно, есть тут частичка правды. Особенно страдает качество, если применять «ИИ» к задачам «на логику». 
Вот, например, посмотрим как «ИИ» справляются с задачкой из 5 класса мат. школы.  Я ее использую её как мини-тест, когда выходит новая модель, чтобы проверить рекламные обещания:


см. Задачу 14 (Кстати, можете попробовать ее решить. Я лично пока нашел 2 способа. )
Задача из 5 класса, которая ломает ChatGPT и ему подобных

Я загонял ее в разные модели — от GPT до Grok и Gemini. Они начинают бодро рассуждать, но потом, почти всегда, произносят магическую фразу:

«Взвесим кучу A и кучу B. Если они равны, значит фальшивые монеты в куче C нет.»

И это, конечно, ошибка.
Потому что фальшивки могут быть и в куче C — обе сразу.
То есть модель сделала логично построенный с точки зрения языка и контекста, но абсолютно ложный вывод.

(полное решение от ChatGPT см. ниже)

Чем мне эта информация помогает в применении LLM:

  1. Постоянно при решении своих задач напоминаю себе, как работает Большая Языковая Модель. Это не мыслитель, а предсказатель следующего слова c учетом контекста.У него нет пока понимания задачи, только языковая статистика.
    Минус при использовании: Все чаще замечаю ситуации, когда мне лень проверять ответ (это может стать проблемой при частом использовании).
  2. Заранее думаю, какой тип задачи подать в ллм для эффективного использования и как.
    Например, стоит ли давать условия по шагам? Или лучше использовать формат цепочки рассуждений (Chain-of-thought)?
    Поштурмить — ок. Но если задача требует чёткой логики и шагов — стараюсь действовать аккуратно.


Решение от ChatGPT:

«Давай внимательно разберем задачу 14:

Условие:

  • Есть три кучки монет:

    • Первая кучка — 18 монет

    • Вторая кучка — 23 монеты

    • Третья кучка — 27 монет.

  • Среди всех этих монет есть две фальшивые монеты.

  • Фальшивые монеты легче настоящих, но одинаковы по массе между собой.

  • Настоящие монеты одинаковы по массе.

  • Нужно за два взвешивания на чашечных весах (без гирь!) определить, в какой кучке находятся только настоящие монеты.

Поскольку известно, что только в одной из куч нет фальшивых монет, а две другие содержат две фальшивые монеты (возможно обе в одной, возможно по одной в каждой), то нам нужно определить „настоящую“ кучку.

Обозначим кучки:

  • A — 18 монет

  • B — 23 монеты

  • C — 27 монет.


Стратегия:

1️⃣ Первое взвешивание:

Возьмем любые две кучки и сравним их массу. Например:

Сравним B (23 монеты) и C (27 монет):

  • Если весы в равновесии — значит в обеих кучках нет фальшивых монет → тогда кучка A (18 монет) обязательно содержит обе фальшивые монеты, а настоящая кучка любая из B или C.

  • Если одна из чаш окажется легче — значит в этой кучке есть хотя бы одна фальшивая монета.

2️⃣ Второе взвешивание:

Теперь выбираем одну из кучек из первого взвешивания и сравниваем её с A.

Например, если оказалось, что B легче C, то делаем:

Сравниваем B и A.

  • Если теперь B и A весят одинаково, значит все фальшивки были в C → A — настоящая.

  • Если снова B легче, значит в B находятся фальшивые монеты → настоящая кучка — C.

  • Если B тяжелее A — значит фальшивки были в A → настоящая кучка — B.


Таким образом, за два взвешивания мы можем однозначно определить, где настоящие монеты.»

 


Несмотря на этот откровенный «косяк», есть множество задач, гре нейросеть Мегаэффективна. Такие кейсы я для себя коллекционирую и выкладываю сюда: 👉  Каталог полезных кейсов по эффективному применению ИИ на работе и жизни
21 Комментарий
  • VolontaireFromSPb
    20 июня 2025, 15:05
    Удивительное решение.
    Взвешивая кучки из разного количества монет, какой полезный вывод можно получить?
  • VolontaireFromSPb
    20 июня 2025, 15:21
    Навскидку надо взвешивать по 18 монет, но двух взвешиваний явно недостаточно.
    Вспомнил молодость и математический кружок Дворца пионеров.
  • vovA4546
    20 июня 2025, 16:43
    делим 2 группу на 16+7, получаем 1 взвешивание:
    на одной чаше весов 18 монет 1 группа и 16 монет 2 группа, на второй 27 третья группа и 7 из второй, по 34 монеты на каждой чаше весов.

    если не равны то искомая «настоящая» группа либо 1 либо 3

    если равны то делим четную группу пополам и взвешиваем:

    если равны, то группа 1  «настоящая», если нет, то настоящая 2.

    но это не для 5 класса задача, думаю для 9-11-го подойдет. Еще чат жпт очень сильно лажает с пространственной геометрией, вообще понимания смысла задачи ноль.
  • Beach Bunny
    20 июня 2025, 17:01

    Это Gemeni 2.5 Pro, ChatGPT тоже бы решил, но тут уже ответов понаписали и это все сразу же находится ботом.
    --------------
    Конечно, вот решение этой задачи.

    Обозначим кучки:

    • Кучка 1: 18 монет
    • Кучка 2: 23 монеты
    • Кучка 3: 27 монет

    Взвешивание 1

    1. Положите на левую чашу весов все 18 монет из Кучки 1.
    2. Положите на правую чашу весов 18 монет, взятых из Кучки 3. Оставшиеся 9 монет из Кучки 3 пока отложите в сторону.

    Возможны три результата:

    • Случай А: Левая чаша легче (Кучка 1 легче 18 монет из Кучки 3). Это означает, что в Кучке 1 точно есть хотя бы одна фальшивая монета. Кучка 1 не является искомой. Настоящие монеты могут быть только в Кучке 2 или в Кучке 3. Переходим ко второму взвешиванию, чтобы определить, какая из них.

    • Случай Б: Правая чаша легче (18 монет из Кучки 3 легче Кучки 1). Это означает, что в Кучке 3 точно есть хотя бы одна фальшивая монета. Кучка 3 не является искомой. Настоящие монеты могут быть только в Кучке 1 или в Кучке 2. Переходим ко второму взвешиванию.

    • Случай В: Весы в равновесии. Это самый интересный случай. Он означает, что либо в обеих взвешиваемых группах нет фальшивых монет, либо в них по одной фальшивой монете. Это исключает Кучку 3 (в ней не может быть двух фальшивых монет, иначе равновесия бы не было). Значит, искомая кучка — это либо Кучка 1, либо Кучка 2. Переходим ко второму взвешиванию.

    Взвешивание 2

    В зависимости от результата первого взвешивания:

    • После случая А (Кучка 1 легче):

      1. Уберите монеты с весов.
      2. Положите на левую чашу все 23 монеты из Кучки 2.
      3. Положите на правую чашу 23 монеты, взятые из Кучки 3.
      • Если левая чаша (Кучка 2) легче, значит, в ней есть фальшивые монеты. Искомая кучка — Кучка 3.
      • Если правая чаша (из Кучки 3) легче, значит, в ней есть фальшивые монеты. Искомая кучка — Кучка 2.
      • Если весы в равновесии, это значит, что фальшивые монеты находятся в отложенных 4 монетах из Кучки 3. Искомая кучка — Кучка 2.
    • После случая Б (Кучка 3 легче):

      1. Уберите монеты с весов.
      2. Положите на левую чашу все 18 монет из Кучки 1.
      3. Положите на правую чашу 18 монет, взятых из Кучки 2.
      • Если левая чаша (Кучка 1) легче, в ней есть фальшивка. Искомая кучка — Кучка 2.
      • Если правая чаша (из Кучки 2) легче, в ней есть фальшивка. Искомая кучка — Кучка 1.
      • Если весы в равновесии, это значит, что фальшивые монеты находятся в отложенных 5 монетах из Кучки 2. Искомая кучка — Кучка 1.
    • После случая В (весы были в равновесии): Выполняем те же действия, что и после случая Б.

      1. Уберите монеты с весов.
      2. Положите на левую чашу все 18 монет из Кучки 1.
      3. Положите на правую чашу 18 монет, взятых из Кучки 2.
      • Если левая чаша (Кучка 1) легче, в ней фальшивка. Искомая кучка — Кучка 2.
      • Если правая чаша (из Кучки 2) легче, в ней фальшивка. Искомая кучка — Кучка 1.
      • Если весы в равновесии, значит, обе фальшивые монеты находятся в Кучке 2 (в тех 5 монетах, что не участвовали во взвешивании). Искомая кучка — Кучка 1.

    Таким образом, за два взвешивания мы гарантированно находим кучку, в которой все монеты настоящие.

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн