Я давно слежу за развитием больших языковых моделей и периодически тестирую их на задачах разной сложности — от бытовых вопросов до профессиональных. В этот раз мне захотелось проверить, на что способна свежая модель Anthropic — Claude Opus 4.6, сможет ли она написать полноценный инвестиционный анализ публичной компании.
В качестве подопытного я выбрал ПАО «Северсталь» (CHMF), которая как раз опубликовала годовую отчетность за 2025 год.
Что я дал модели на вход:
Я загрузил четыре документа: саму консолидированную финансовую отчётность Северстали за 2025 год, официальный пресс-релиз с результатами за 4 квартал и 12 месяцев 2025 года, а также два обзора, сгенерированных через Deep Research в ChatGPT и Gemini. Мне было интересно, сможет ли Opus критически оценить чужие выводы, а не просто скопировать их. В промпте я специально предупредил: Deep Research использовать как контекст, но не принимать на веру, а ключевые утверждения верифицировать по первичным источникам.
