Недавно Кирилл Пшинник из «Зерокодер» проверил ChatGPT o3 и o4-mini-high (модели с рассуждением) на демо-ЕГЭ-2025 (русский, математика профиль, физика, география, обществознание).
Средний результат — 90-100 баллов, по математике — чистые 100.
Для сравнения: средний балл прошлого года в
То есть проходной в топовые вузы ИИ берёт «с первой попытки» (forbes.ru).
Я не собираюсь долго спорить о «смерти ЕГЭ» или о том, что «машины вытеснят людей». Меня зацепило другое: Даже с развитием LLM, в очередной раз выигрывает тот, кто умеет пользоваться ресурсами (знаниями).
Долго (но не всегда) прокатывало быть просто эрудированным: блеснул датами — получил плюсик. Но с появлением LLM эрудиция сильно обесценивается: GPT помнит больше, умеет искать факты быстрее и лучше + не забывает (правда галлюцинирует пока).
Часто, взаимодействуя с людьми, мы не только сотрудничаем, но и дискутируем в самых разных ситуациях: коллеги, клиенты, строители и продавцы (это вообще высший уровень), и иногда лично у меня там больше эмоций, чем следует. Это отрицательно влияет, как вы понимаете, на эффективное решение вопросов.
Я давно слышал о методе Сократа в дискуссиях, но как-то постоянно не доходили руки разобраться, что это вообще такое. Особенно тепло о нём отзывался Бенджамин Франклин в своей автобиографии: он рассказывал, что этот подход помогал ему практически всегда выигрывать споры — просто за счёт цепочки вопросов и неожиданных выводов (хотя потом он его забросил – споры разъединяют). Казалось бы, ничего сложного, но работает удивительно.
Как-то раз мне попалась реклама курсов, где обещали научить этому методу. Честно — чуть не кликнул на “Записаться”, но потом решил попробовать лайфхак попроще: открыл ЧатГПТ в голосовом режиме и сказал ему примерно следующее:
«Ты опытный тренер по обучению Сократовскому методу дискуссии с самых-самых азов, прям для новичков, и обучение происходит в диалоге. Я новый ученик. Давай начнем обучение.»
У Perplexity (поисковик с ИИ, которым многие, включая меня уже пользуются чаще яндекса) появился новый режим — Answers for Every Investor. Обещают, что теперь можно задавать вопросы про публичные компании и получать ответы не “от балды”, а с опорой на официальные документы, опубликованные в EDGAR/SEC.
EDGAR — Внутренняя система баз данных, управляемая Комиссией по ценным бумагам и биржам США, которая выполняет автоматический сбор, проверку достоверности, индексацию и акцептованную пересылку заявок компаний и других лиц, которые по закону обязаны подавать формы в SEC. База данных содержит огромное количество информации о комиссии и индустрии ценных бумаг, которая находится в свободном доступе для общественности через Интернет.
Что конкретно заявлено:
В ответах теперь используются выдержки из отчётности компаний — 10-K, 10-Q и прочих файлов, которые компании обязаны публиковать.
Каждый ответ снабжён ссылками — можно перейти прямо на оригинал и проверить формулировку.
Google представила на Google I/O 2025 новую линейку очков на базе Android XR. Возможно, вы помните, что Google Glass появились ещё в 2013 году. Тогда проект провалился — очки оказались дорогими, неудобными, да и в жизни толком не пригодились.
Почему же Google решилась на вторую попытку именно сейчас?
Официальная причина — подешевели компоненты, технологии стали лучше. Но мне кажется, есть причина куда более важная: сегодня у ИИ-компаний заканчиваются данные для обучения нейросетей. Они уже просят правительство разрешить читать/смотреть весь контент (даже под авторскими правами) и готовы платить до 4 долларов за минуту неизданного видео! И Очки — идеальный инструмент, чтобы собирать такие данные прямо из нашей жизни: камеры, микрофоны, динамик, дисплей — ассистент “видит” и “слышит” всё вокруг.
Т.о. главным “потребителем” этих данных становится не человек, а искусственный интеллект.
Нет, это не теория заговора, а просто бизнес. Google пользуется своим преимуществом перед OpenAI: через очки, смартфоны и YouTube она может получить доступ к миллионам сценариев, которые никто ещё не записывал. И мы ему заплатим за это, а не он нам. )
Карпаты отмечает, что LLM предоставляют «квази-экспертизу» по многим вопросам, позволяя людям без специализированного образования:
Писать код, используя простые описания задач.
Анализировать большие объемы данных и извлекать из них инсайты.
Создавать качественный контент и презентации.
Получать советы по различным вопросам, от юридических до психологических.
Эти возможности делают LLM мощным инструментом для самообразования и повышения эффективности в повседневной жизни.
Наступает пора отпусков, и скоро в Смарт-Лабе появится больше, чем обычно, фотоотчётов. Лично я их очень люблю (но в меру), так как от рынка тоже нужно иногда отдыхать.
Решил поделиться тестированием ChatGPT в роли гида. Смартфон всегда под рукой: в путешествиях можно быстро спросить у ИИ обо всём, что заинтересовало. Способ оказался эффективнее, чем я ожидал, — возможно, кому-то сэкономит время, которое, как известно, = деньги. Честно, думал, GPT справится хуже, но ошибся (объект не самый известный, мог перепутать).
ссылка на Rutube
P.S. Увы, функция доступна только в платной версии ChatGPT (Plus)
Всем приятных путешествий и удачных сделок!
Подписывайтесь на мой Telegram-канал. Там разбираю примеры применения LLM, которые использую сам.
По работе мне постоянно приходится быть в курсе разных нейросетей и простых решений на них, чтобы подсмотреть часть идей для использования в компании. В феврале я наткнулся на исследование OpenAI под названием SWE-Lancer, в котором ИИ должен был заработать $1 млн .
Что такое SWE-Lancer? Если коротко, то
Опытные специалисты из OpenAI (разработчик ChatGPT) выгрузили с фриланс-биржи Upwork кучу задач. Далее отобрали только те, где в описании есть все данные для решения задачи. Осталось 1488 штуки. После этого начали тестировать как с ними справятся нейросети.
Сколько «заработали» нейросети (в теории)?
Самая лучшая на тот момент, Claude 3.5 Sonnet, успешно справилась с 26,2% задач кодирования и 44,9% решений по управлению проектами (например: выбор подрядчиков, оценка рисков, распределение бюджета).
Что меня особенно заинтересовало в этом исследовании: ИИ оказался сильнее в принятии решений, чем в написании кода, при том, что в СМИ рассуждают о программистах, копирайтерах и дизайнерах. У меня на работе больше менеджеров, чем программистов, но есть вероятность, что они не очень будут рады новым возможностям по использованию нейросетей.
📌 Что в ролике:
✔ Как автоматически классифицировать строки в таблице. Сделал на примере покупок во ВкусВилл
✔ Пример промпта для достаточно точной разметки. Там он простой, но можно гораздо больше накрутить
✔ Экономия времени и снижение ошибок
(Звука нет, но, надеюсь, там все понятно сделал)
Если будут вопросы, спрашивайте в комментариях.
ссылка на rutube
Если вам интересны практические примеры применения LLM (DeepSeek, ChatGPT и пр.) для работы и жизни — подписывайтесь на мой тг-канал
Согласно последней годовой отчётности, к концу декабря общая численность сотрудников Shopify сократилась до 8100 человек по сравнению с 8300 годом ранее.
Возможно эти шаги направлены на повышение эффективности и внедрение автоматизированных инструментов, которые способны заменить рутинные задачи, при этом позволяя работникам сосредоточиться на более интересных задачах.
CEO Shopify, Тобиас Литке, 07 апреля обратился ко всей команде, подчеркивая, что в современных условиях искусственный интеллект становится не просто инструментом, а настоящим мультипликатором возможностей. Основные идеи его обращения можно резюмировать так:
В предыдущем посте я показал, как легко сделать саммари из книги с помощью ИИ (ключевые идеи + упражнения, даже если их там нет) .
Продолжаю выкладывать обработанный вариант. Посмотрим, как он справится с новой главой: