Блог им. Kommersant_ru

«Яндекс» и МТС разошлись в способах оценки ИИ

Активно развивающийся рынок искусственного интеллекта начинает сталкиваться с проблемами, характерными для развитых отраслей, например, выбора адекватной методики оценки эффективности. Российские разработчики больших языковых моделей (используются, в частности, для создания голосовых ассистентов) выбрали разные инструменты для публичного сравнения с другими разработками. Так, экспериментальная версия YandexGPT оценивается путем парного сравнения на «чатбот-арене», а модели MTS AI — путем решения заранее определенных задач. Участники рынка указывают на возможность использования разных бенчмарков эффективности для разных вопросов.

Подробнее — в материале «Ъ».
157

Читайте на SMART-LAB:
Мировой рынок золота столкнулся с ограничением добычи
Мировой рынок золота продолжает расти, несмотря на крайне ограниченное расширение добычи. По данным Всемирного совета по золоту (WGC), в 2025 году...
Обновление кредитных рейтингов в ВДО и розничных облигациях (ООО «Сергиевское» подтвержден BB-.ru, ООО «АГРОДОМ» понижен до С(RU))
🟢ООО «Сергиевское» НКР подтвердило кредитный рейтинг на уровне BB-.ru. ООО «Сергиевское» — сельскохозяйственное предприятие, расположенное в...
Разруливаем год Делимобиля в шоу «Акционеры. Цифры»
Провели эфир с топ-менеджерами оператора каршеринга — компании Делимобиль. Узнали из первых уст взгляд на финансовые результаты бизнеса за...
Фото
Совкомбанк МСФО 2025 г. - чем это лучше Сбера?
Совкомбанк опубликовал финансовые результаты за 2025 год. Чистая прибыль снизилась на 31% до 53,2 млрд руб., в 4-ом квартале снижение...

теги блога Коммерсантъ

....все тэги



UPDONW
Новый дизайн