Блог им. Replikant_mih

По-дружески стресс-тестим LLM

Был в игривом настроении, решил подловить ИИшку. 

По-дружески стресс-тестим LLM
По-дружески стресс-тестим LLM
По-дружески стресс-тестим LLM

Есть любители занижать оценку возможностей LLM моделей. По мне так текущие модели очень-очень бодрые на текущем уровне и очень очень полезные уже.

 

Есть такая штука как radar chart, типа такой (см. ниже), если декомпозировать интеллект на составляющие и отразить на таком графике картинку меры выраженности скиллов для среднего человека и LLM — да, они будут отличаться, и сильно, конечно. 

 

НО:
— Не факт что площадь фигуры у LLM будет, ниже, чем у человека.
— Так-то все люди между собой тоже нехило так отличаются и по выраженности разных скилов и по равномерности их выраженности и по площади фигуры.

 

По-дружески стресс-тестим LLM

335
2 комментария
|-, Какая модель не помню была, а сервис вот этот: apps.abacus.ai/chatllm
avatar

Читайте на SMART-LAB:
Фото
Долгосрочное инвестирование умерло. В этот раз - без "но". Хороших новостей не будет
Увеличение капитала посредством инвестирования в доли компаний всегда основывалось на двух тезисах (1) компания сможет на длительном...
Фото
Как на самом деле используют ИИ в алготрейдинге
Если первая часть моего репортажа по конференции алготрейдеров в Москве была об инфраструктуре, то вторая часть будет про искусственный...
«Профи» из группы Займер окупил первый приобретенный портфель
Делимся новостями коллекторского агентства из группы Займер. КА «Профи» вышло на точку окупаемости по первому приобретенному портфелю. ⚡️ Для...
Фото
Ростелеком. МСФО за Q4 2025г. Всё неплохо… но всё равно печально…
Компания Ростелеком опубликовала финансовые результаты за 4 квартал 2025г.: 👉Выручка — 270,5 млрд руб. (+15,6% г/г) 👉Операционные...

теги блога Replikant_mih

....все тэги



UPDONW
Новый дизайн