Блог им. Zashibis
Я достаточно часто пишу и обсуждаю с коллегами про то, как использовать нейросети с пользой — для работы, бизнеса и жизни. И почти в каждом втором обсуждении кто-то пишет что-то вроде: «Да что вы от него хотите, это же просто болтающий калькулятор. Просто много рассуждает, врет и думать не умеет».
Конечно, есть тут частичка правды. Особенно страдает качество, если применять «ИИ» к задачам «на логику».
Вот, например, посмотрим как «ИИ» справляются с задачкой из 5 класса мат. школы. Я ее использую её как мини-тест, когда выходит новая модель, чтобы проверить рекламные обещания:
см. Задачу 14 (Кстати, можете попробовать ее решить. Я лично пока нашел 2 способа. )

Я загонял ее в разные модели — от GPT до Grok и Gemini. Они начинают бодро рассуждать, но потом, почти всегда, произносят магическую фразу:
«Взвесим кучу A и кучу B. Если они равны, значит фальшивые монеты в куче C нет.»
И это, конечно, ошибка.
Потому что фальшивки могут быть и в куче C — обе сразу.
То есть модель сделала логично построенный с точки зрения языка и контекста, но абсолютно ложный вывод.
(полное решение от ChatGPT см. ниже)
«Давай внимательно разберем задачу 14:
Условие:
Есть три кучки монет:
Первая кучка — 18 монет
Вторая кучка — 23 монеты
Третья кучка — 27 монет.
Среди всех этих монет есть две фальшивые монеты.
Фальшивые монеты легче настоящих, но одинаковы по массе между собой.
Настоящие монеты одинаковы по массе.
Нужно за два взвешивания на чашечных весах (без гирь!) определить, в какой кучке находятся только настоящие монеты.
Поскольку известно, что только в одной из куч нет фальшивых монет, а две другие содержат две фальшивые монеты (возможно обе в одной, возможно по одной в каждой), то нам нужно определить „настоящую“ кучку.
Обозначим кучки:
A — 18 монет
B — 23 монеты
C — 27 монет.
Стратегия:
1️⃣ Первое взвешивание:
Возьмем любые две кучки и сравним их массу. Например:
Сравним B (23 монеты) и C (27 монет):
Если весы в равновесии — значит в обеих кучках нет фальшивых монет → тогда кучка A (18 монет) обязательно содержит обе фальшивые монеты, а настоящая кучка любая из B или C.
Если одна из чаш окажется легче — значит в этой кучке есть хотя бы одна фальшивая монета.
2️⃣ Второе взвешивание:
Теперь выбираем одну из кучек из первого взвешивания и сравниваем её с A.
Например, если оказалось, что B легче C, то делаем:
Сравниваем B и A.
Если теперь B и A весят одинаково, значит все фальшивки были в C → A — настоящая.
Если снова B легче, значит в B находятся фальшивые монеты → настоящая кучка — C.
Если B тяжелее A — значит фальшивки были в A → настоящая кучка — B.
Таким образом, за два взвешивания мы можем однозначно определить, где настоящие монеты.»
Взвешивая кучки из разного количества монет, какой полезный вывод можно получить?
Вспомнил молодость и математический кружок Дворца пионеров.
VolontaireFromSPb, один из вариантов решения:
1. Делаю три кучи 18 (а), 18+5 (б), 18+9(ц)
2. взвешиваю а с б
— если а>б — куча 1
3. если а = б, взвешиваю а и ц
— а>ц — куча 1
— а=ц — куча 1
— а < ц — куча 3
4. Если а < б, то взвешиваю а и б, но 5 монет заменяю в б на те, что отложил (б это 18+5). Получаем б1
5. а = б1 — куча 3 (ц)
6. а < б1 - куча 2 (б)
на одной чаше весов 18 монет 1 группа и 16 монет 2 группа, на второй 27 третья группа и 7 из второй, по 34 монеты на каждой чаше весов.
если не равны то искомая «настоящая» группа либо 1 либо 3
если равны то делим четную группу пополам и взвешиваем:
если равны, то группа 1 «настоящая», если нет, то настоящая 2.
но это не для 5 класса задача, думаю для 9-11-го подойдет. Еще чат жпт очень сильно лажает с пространственной геометрией, вообще понимания смысла задачи ноль.
Это Gemeni 2.5 Pro, ChatGPT тоже бы решил, но тут уже ответов понаписали и это все сразу же находится ботом.
--------------
Конечно, вот решение этой задачи.
Обозначим кучки:
Взвешивание 1
Возможны три результата:
Случай А: Левая чаша легче (Кучка 1 легче 18 монет из Кучки 3). Это означает, что в Кучке 1 точно есть хотя бы одна фальшивая монета. Кучка 1 не является искомой. Настоящие монеты могут быть только в Кучке 2 или в Кучке 3. Переходим ко второму взвешиванию, чтобы определить, какая из них.
Случай Б: Правая чаша легче (18 монет из Кучки 3 легче Кучки 1). Это означает, что в Кучке 3 точно есть хотя бы одна фальшивая монета. Кучка 3 не является искомой. Настоящие монеты могут быть только в Кучке 1 или в Кучке 2. Переходим ко второму взвешиванию.
Случай В: Весы в равновесии. Это самый интересный случай. Он означает, что либо в обеих взвешиваемых группах нет фальшивых монет, либо в них по одной фальшивой монете. Это исключает Кучку 3 (в ней не может быть двух фальшивых монет, иначе равновесия бы не было). Значит, искомая кучка — это либо Кучка 1, либо Кучка 2. Переходим ко второму взвешиванию.
Взвешивание 2
В зависимости от результата первого взвешивания:
После случая А (Кучка 1 легче):
После случая Б (Кучка 3 легче):
После случая В (весы были в равновесии): Выполняем те же действия, что и после случая Б.
Таким образом, за два взвешивания мы гарантированно находим кучку, в которой все монеты настоящие.
Beach Bunny, Т.е. если обе фальшивые монеты в куче 3, то дальше LLM предлагает взвесить опять 18 монет из кучи 1 и кучи 2 (После случая В (весы были в равновесии).
И тогда
- Если весы в равновесии (а они будут в равновесии), значит, обе фальшивые монеты находятся в Кучке 2 (в тех 5 монетах, что не участвовали во взвешивании). Искомая кучка — Кучка 1.
Я правильно понял? Интересно, почему не 2, но это риторический вопрос.Гпт платный не решил. Джемини платный не пробовал. Чуб, придется менять скоро задачу для теста
Отличный вопрос! Давайте разберем именно этот сценарий, используя предложенный метод.
Исходные данные:
Взвешивание 1
Мы кладем на весы:
Здесь возможны два варианта развития событий, в зависимости от того, попали ли фальшивые монеты в нашу выборку из 18 монет:
Вариант А: На правую чашу попала хотя бы одна фальшивая монета.
Вариант Б: Обе фальшивые монеты остались в тех 9 монетах Кучки 3, что мы отложили.
Взвешивание 2
Теперь посмотрим, что покажет второе взвешивание для каждого из этих вариантов.
Если сработал Вариант А (правая чаша была легче):
Если сработал Вариант Б (весы были в равновесии):
Итог: Если обе фальшивые монеты лежат в Кучке 3, предложенный алгоритм в любом случае за два взвешивания безошибочно определит кучку, в которой все монеты настоящие (в данном конкретном сценарии это будет либо Кучка 1, либо Кучка 2, и весы это покажут).
Ответ правильный, сам алгоритм тоже, но логика объяснения результатов не полностью верна. Значит на модель полагаться нельзя, к сожалению нельзя
«Если весы в равновесии, значит, обе фальшивые монеты находятся в Кучке 2 (в тех 5 монетах, что не участвовали во взвешивании)»
Это не так, фальшивые монеты могут быть и в отложенных из кучи 2 и из кучи 3 или и в 3 и в 2
Надо найти Кучу где Настоящиие, она и найдена, то что в вашем случае получилось 2 кучи с настоящими, это не важно, в условии: «Найди кучу в которой все настоящие» — Что значит -> найди ОДНУ кучу! ЛЮБУЮ ОДНУ!
Вопрос не подразумевает рассказ о всех возможных вариантах!
Если не нравится ответ, то формулируйте другой вопрос, где укажите все что вам нужно.