Блог им. Kommersant_ru

«Яндекс» и МТС разошлись в способах оценки ИИ

Активно развивающийся рынок искусственного интеллекта начинает сталкиваться с проблемами, характерными для развитых отраслей, например, выбора адекватной методики оценки эффективности. Российские разработчики больших языковых моделей (используются, в частности, для создания голосовых ассистентов) выбрали разные инструменты для публичного сравнения с другими разработками. Так, экспериментальная версия YandexGPT оценивается путем парного сравнения на «чатбот-арене», а модели MTS AI — путем решения заранее определенных задач. Участники рынка указывают на возможность использования разных бенчмарков эффективности для разных вопросов.

Подробнее — в материале «Ъ».
157

Читайте на SMART-LAB:
🍞Акрон: неплохо, но есть другие варианты
Производитель удобрений отчитался по МСФО за 2025 год   Акрон (AKRN) ➡️ Инфо и показатели     🔶 Результаты за год — выручка: ₽237,6...
Фото
Делимся обновленными результатами и ключевыми показателями на 23 марта
Друзья, привет! ✅ Делимся обновленными результатами и ключевыми показателями: с начала года мы уже передали нашим клиентам 7567 ключей от...
Рубль под давлением: какие активы под угрозой?
Ставка падает, рубль слабеет — это новая экономическая реальность или временный эффект? Разбираем, что на самом деле происходит с бюджетом и...
Фото
X5 МСФО 2025 г. - капзатрат меньше, дивиденд больше?
Компания X5 опубликовала финансовые результаты за 2025 год. Выручка прибавила +18,8% до 4,6 трлн руб., в 4-м квартале рост на 14,9% до 1,24...

теги блога Коммерсантъ

....все тэги



UPDONW
Новый дизайн