
#AI #datacenters #YDEX #SBER
Со стороны компаний часто можно увидеть информационные вбросы по поводу того что по каким-то бенчмаркам Гигачат Сбера или Алиса AI Яндекса обошли какие-то китайские LLM модели. Главы компаний на различных отраслевых мероприятиях говорят о том, что они находятся на острие технологического прогресса в сфере ИИ.
В этом посте я хочу объяснить почему это все попросту не может быть правдой и не будет правдой в ближайшие 5 лет как минимум, да и в целом наверное никогда.
_______________
Сначала давайте убедимся в том, что Российские модели сильно отстают от передовых моделей США и Китая
В таблице ниже приведено сравнение передовых (фронтирных/frontier) моделей от текущих глобальных лидеров в этом напарвлении (Anthropic с моделью Claude, Open AI с моделью Chat GPT и Google c моделью Gemini), от китайских лидеров (Alibaba c Qwen и DeepSeek) c нашими моделями от Яндекса и Сбера.
Сразу следует отметить, что по российским моделям тяжело собрать сопоставимые данные. Российские модели объективно отстают на поколение-полтора, и их собственные бенчмарки несопоставимы с международными (тестировались против GPT-4o/Qwen-2.5, а не текущих флагманов) поэтому сравнение получается неполным.





Интересные возможности появляются практически каждый день, поэтому я всегда стараюсь не сожалеть об упущенных. Но все же, иногда, оглядываясь назад, начинаешь думать, что нужно было сделать так, а не иначе.
Вот и сейчас, мне кажется я стою на таком перепутье, где нужно принять решение, от которого во многом будет зависеть буду ли я с сожалением вспоминать о сделанном, долгие годы спустя. В общем, хватить долгих предисловий, перейду к сути.
Много лет назад, я уже обдумывал покупку квартиры у моря, и тогда пришел к выводу, что мне это не надо. Но время идет, я взрослею/старею, дети растут. Время от времени задаешься вопросом, может быть уже хватит бежать как белка в колесе, и пора остановиться и просто наслаждаться результатами своей деятельности и вообще жизнью!?… тьфу ты, опять лирические отступления.
Небольшая заметка — посмотрел интересное видео около ML о том как адаптировать торговые стратегии к изменениям рыночного режима (regime changes).
И здесь основная проблема в нестационарности финансовых временных рядов, где статистические свойства (среднее, дисперсия и др.) постоянно меняются со временем.
У видео есть автоперевод на русский язык.

Видео: https://www.youtube.com/watch?v=X5QcNyYRMqQ
Автор рассматривает три метода адаптации: