Блог им. Zashibis |Задача из 5 класса, которая ломает ChatGPT и ему подобных

Я достаточно часто пишу и обсуждаю с коллегами про то, как использовать нейросети с пользой — для работы, бизнеса и жизни. И почти в каждом втором обсуждении кто-то пишет что-то вроде: «Да что вы от него хотите, это же просто болтающий калькулятор. Просто много рассуждает, врет и думать не умеет».

Конечно, есть тут частичка правды. Особенно страдает качество, если применять «ИИ» к задачам «на логику». 
Вот, например, посмотрим как «ИИ» справляются с задачкой из 5 класса мат. школы.  Я ее использую её как мини-тест, когда выходит новая модель, чтобы проверить рекламные обещания:


см. Задачу 14 (Кстати, можете попробовать ее решить. Я лично пока нашел 2 способа. )
Задача из 5 класса, которая ломает ChatGPT и ему подобных

Я загонял ее в разные модели — от GPT до Grok и Gemini. Они начинают бодро рассуждать, но потом, почти всегда, произносят магическую фразу:

«Взвесим кучу A и кучу B. Если они равны, значит фальшивые монеты в куче C нет.»

И это, конечно, ошибка.
Потому что фальшивки могут быть и в куче C — обе сразу.



( Читать дальше )

Блог им. Zashibis |ЕГЭ, ChatGPT и стартапы без команды с выручкой по $10 млн: что тут общего?

Недавно Кирилл Пшинник из «Зерокодер» проверил ChatGPT o3 и o4-mini-high (модели с рассуждением) на демо-ЕГЭ-2025 (русский, математика профиль, физика, география, обществознание).

Средний результат — 90-100 баллов, по математике — чистые 100.

Для сравнения: средний балл прошлого года в

  • МФТИ — 97
  • НИЯУ МИФИ — 89,9
  • Иннополис — 87,5
  • ВШЭ — 87,1.

То есть проходной в топовые вузы ИИ берёт «с первой попытки» (forbes.ru).

ЕГЭ, ChatGPT и стартапы без команды с выручкой по $10 млн: что тут общего?



Что для меня в этой новости интересно:

Я не собираюсь долго спорить о «смерти ЕГЭ» или о том, что «машины вытеснят людей». Меня зацепило другое: Даже с развитием LLM, в очередной раз выигрывает тот, кто умеет пользоваться ресурсами (знаниями).

Долго (но не всегда) прокатывало быть просто эрудированным: блеснул датами — получил плюсик. Но с появлением LLM эрудиция сильно обесценивается: GPT помнит больше, умеет искать факты быстрее и лучше + не забывает (правда галлюцинирует пока). 



( Читать дальше )

Блог им. Zashibis |Авиакатасрофа в Индии - Один человек выжил. Действительно ли место 11А самое безопасное?

Вчера была тяжёлая новость: в Индии разбился Boeing 787-8, и из 242 человек выжил только один пассажир — мужчина, сидевший на месте 11A. Такие истории всегда выбивают из колеи — от новостей о катастрофах становится не по себе, даже если сам не боишься летать.

Но как ни странно, именно из каждой подобной трагедии авиация становится безопаснее. Авиастроители всего мира разбирают каждую аварию буквально по винтику — и потом дорабатывают конструкции, меняют стандарты, чтобы подобное не повторилось.

Поэтому сегодня полёты — это самый безопасный вид транспорта
Авиакатасрофа в Индии - Один человек выжил. Действительно ли место 11А самое безопасное?

Я решил подойти к этому вопросу с помощью нейросети — разобраться, действительно ли место 11A такое “особенное”, или просто случайность. Заодно понять, есть ли вообще “правильный” выбор кресла, если хочется минимизировать риск.

 

Сначала я поискал статистику именно по Boeing 787-8, но оказалось, что это была первая в истории Dreamliner катастрофа со смертельным исходом. До этого — с 2011 года — ни одной гибели пассажиров на этом типе не было, несмотря на мелкие инциденты и даже проблемы с аккумуляторами в 2013-м.



( Читать дальше )

Блог им. Zashibis |Как я учился вести споры по методу Сократа с помощью ChatGPT⁠⁠

Часто, взаимодействуя с людьми, мы не только сотрудничаем, но и дискутируем в самых разных ситуациях: коллеги, клиенты,  строители и продавцы (это вообще высший уровень), и иногда лично у меня там больше эмоций, чем следует. Это отрицательно влияет, как вы понимаете, на эффективное решение вопросов.

Я давно слышал о методе Сократа в дискуссиях, но как-то постоянно не доходили руки разобраться, что это вообще такое. Особенно тепло о нём отзывался Бенджамин Франклин в своей автобиографии: он рассказывал, что этот подход помогал ему практически всегда выигрывать споры — просто за счёт цепочки вопросов и неожиданных выводов (хотя потом он его забросил – споры разъединяют). Казалось бы, ничего сложного, но работает удивительно.
Как я учился вести споры по методу Сократа с помощью ChatGPT⁠⁠


Как-то раз мне попалась реклама курсов, где обещали научить этому методу. Честно — чуть не кликнул на “Записаться”, но потом решил попробовать лайфхак попроще: открыл ЧатГПТ в голосовом режиме и сказал ему примерно следующее:

«Ты опытный тренер по обучению Сократовскому методу дискуссии с самых-самых азов, прям для новичков, и обучение происходит в диалоге. Я новый ученик. Давай начнем обучение.»



( Читать дальше )

Блог им. Zashibis |Очки Google — для ИИ, а не ради нас. (Android XR: скрытая цель)

Google представила на Google I/O 2025 новую линейку очков на базе Android XR. Возможно, вы помните, что Google Glass появились ещё в 2013 году. Тогда проект провалился — очки оказались дорогими, неудобными, да и в жизни толком не пригодились.

Очки Google — для ИИ, а не ради нас. (Android XR: скрытая цель)


Почему же Google решилась на вторую попытку именно сейчас?

Официальная причина — подешевели компоненты, технологии стали лучше. Но мне кажется, есть причина куда более важная: сегодня у ИИ-компаний заканчиваются данные для обучения нейросетей. Они уже просят правительство разрешить читать/смотреть весь контент (даже под авторскими правами) и готовы платить до 4 долларов за минуту неизданного видео! И Очки — идеальный инструмент, чтобы собирать такие данные прямо из нашей жизни: камеры, микрофоны, динамик, дисплей — ассистент “видит” и “слышит” всё вокруг.
Т.о. главным “потребителем” этих данных становится не человек, а искусственный интеллект.

Нет, это не теория заговора, а просто бизнес. Google пользуется своим преимуществом перед OpenAI: через очки, смартфоны и YouTube она может получить доступ к миллионам сценариев, которые никто ещё не записывал. И мы ему заплатим за это, а не он нам. )



( Читать дальше )

Блог им. Zashibis |LLM на текущий момент даёт больше обычным людям, чем корпорациям и государствам - Андрей Карпатый

Андрей Карпатый, один из основателей OpenAI и бывший директор по ИИ в Tesla, недавно поделился наблюдением: большие языковые модели (LLM) меняют традиционную траекторию распространения технологий. Обычно инновации сначала внедряются в военной сфере, затем в корпорациях и, наконец, доходят до обычных пользователей. Однако с LLM всё иначе — они приносят наибольшую пользу именно индивидуальным пользователям, а не крупным организациям .

LLM на текущий момент даёт больше обычным людям, чем корпорациям и государствам - Андрей Карпатый


Почему LLM — это революция для обычных людей

Карпаты отмечает, что LLM предоставляют «квази-экспертизу» по многим вопросам, позволяя людям без специализированного образования:

  • Писать код, используя простые описания задач.

  • Анализировать большие объемы данных и извлекать из них инсайты.

  • Создавать качественный контент и презентации.

  • Получать советы по различным вопросам, от юридических до психологических.

Эти возможности делают LLM мощным инструментом для самообразования и повышения эффективности в повседневной жизни.



( Читать дальше )

Блог им. Zashibis |Небольшой тест ChatGPT в качестве экскурсовода. Путешествуйте эффективней.

Наступает пора отпусков, и скоро в Смарт-Лабе появится больше, чем обычно, фотоотчётов. Лично я их очень люблю (но в меру), так как от рынка тоже нужно иногда отдыхать.

Решил поделиться тестированием ChatGPT в роли гида. Смартфон всегда под рукой: в путешествиях можно быстро спросить у ИИ обо всём, что заинтересовало. Способ оказался эффективнее, чем я ожидал, — возможно, кому-то сэкономит время, которое, как известно, = деньги. Честно, думал, GPT справится хуже, но ошибся (объект не самый известный, мог перепутать).



ссылка на Rutube

P.S. Увы, функция доступна только в платной версии ChatGPT (Plus)

Всем приятных путешествий и удачных сделок!

Подписывайтесь на мой Telegram-канал. Там разбираю примеры применения LLM, которые использую сам.


Блог им. Zashibis |Виртуальная команда: Как Сергей нашел ключ к эффективности

Виртуальная команда: Как Сергей нашел ключ к эффективности

Статья основана на реальном применении ChatGPT и DeepSeek в работе. Вопросы по применению LLM для повышения своей эффективности в работе приветствуются.

Сергей, менеджер по инновациям в одной средней компании (около 1000 человек), пялился в экран ноутбука, пролистывая очередной ролик про DeepSeek и ChatGPT. «Два месяца, а толку ноль», — пробормотал он, закрывая вкладку. В голове крутились фразы из видео: «революция в бизнесе», «автоматизация рутины»… Но как это все применить — совершенно непонятно!

Спасением стала курилка. Там он наткнулся на начальника контакт-центра, Игоря, который, выпуская клубы дыма, бубнил: 

— Мои ребята уже роботы! Одни шаблонные ответы, а клиенты злые. Да и сам чёрт ногу сломит — кто из них реально старается, а кто просто кнопки тыкает. Проверять каждую переписку — мне жизни не хватит!  

Сергей замер. В голове щёлкнуло: «LLM… А что, если не только клиентам помогать, но и сотрудников контролировать?» Мысль горела, как искра, но тут же накатил страх: он же в контакт-центре как инопланетянин — процессов не знает, метрик не понимает. 



( Читать дальше )

Блог им. Zashibis |Как вести Дневник трейдера с помощью ChatGPT. Мой эксперимент.

Дневник трейдера (журнал сделок) — это ваш личный «детектор ошибок». Он фиксирует не только цифры и факты, но и эмоции, которые управляют решениями. Это инструмент, который помогает превращать хаотичную торговлю в системный процесс, где каждая сделка — шаг к пониманию своих слабостей и сильных сторон.


 

Мой эксперимент: голосовой дневник + ChatGPT



Недавно я задумался: уже много лет (с 2005 г., с перерывами) я лениво торгую на бирже, но ни разу не использовал дневник трейдера, хотя я очень эмоциональный человек.

Так как я активно работаю с LLM (нейросети — языковые модели), то подумал: почему бы не приспособить для этого ChatGPT?
Ведь я же общаюсь в голосовом режиме с «GPT-психологом» — а здесь в чем принципиальная разница?

Я нашел подходящие вопросы, адаптировал их под себя и загрузил в промпт (инструкцию для ИИ).

 

Как это работает:

 

  1. Подаю промпт с ролью и вопросами.
  2. В голосовом формате (мне лучше подходит этот формат — это как разговор по телефону) попросил:


( Читать дальше )

Блог им. Zashibis |Как за несколько минут выудить полезную информацию из 180 комментариев с помощью LLM (ChatGPT, DeepSeek, Grok и пр.)

Вводные данные:Интригующий пост Тимофея Мартынова, который моя дофаминовая система не смогла проигнорировать:
«Американцы, похоже, готовы быстро вернуться в Россию чуть что.»

Как за несколько минут выудить полезную информацию из 180 комментариев с помощью LLM (ChatGPT, DeepSeek, Grok и пр.)


Как превратить это в структурированные данные?

Мне хотелось бы получить простую табличку:

Компания Полный текст комментария Статус Объяснение
Schlumberger Сервисмены Schlumberger начали предлагать свои услуги нефтяникам... Пытается вернуться Комментарий упоминает активные шаги по возвращению.
YouTube Ролик заканчивается, и теперь нет антирусской повестки... Пытается вернуться Комментатор отмечает изменения в алгоритме.
General Electric Мне на днях звонил один из директоров GE в Москве... Пытается вернуться Упоминается контакт с московским филиалом компании.
Boeing Boeing хочет продавать детали и самолеты в РФ... Пытается вернуться Комментатор утверждает, что Boeing интересуется рынком.
 


Как получить такие данные за 5 минут?

Реальный ответ: если важна точность, то никак. Но я решил проверить, можно ли быстро вытащить данные с помощью LLM.



( Читать дальше )

....все тэги
UPDONW
Новый дизайн