Блог им. Replikant_mih

По-дружески стресс-тестим LLM

Был в игривом настроении, решил подловить ИИшку. 

По-дружески стресс-тестим LLM
По-дружески стресс-тестим LLM
По-дружески стресс-тестим LLM

Есть любители занижать оценку возможностей LLM моделей. По мне так текущие модели очень-очень бодрые на текущем уровне и очень очень полезные уже.

 

Есть такая штука как radar chart, типа такой (см. ниже), если декомпозировать интеллект на составляющие и отразить на таком графике картинку меры выраженности скиллов для среднего человека и LLM — да, они будут отличаться, и сильно, конечно. 

 

НО:
— Не факт что площадь фигуры у LLM будет, ниже, чем у человека.
— Так-то все люди между собой тоже нехило так отличаются и по выраженности разных скилов и по равномерности их выраженности и по площади фигуры.

 

По-дружески стресс-тестим LLM

318
2 комментария
|-, Какая модель не помню была, а сервис вот этот: apps.abacus.ai/chatllm
avatar

Читайте на SMART-LAB:
Фото
Кремниевый юг России: история переезда и развития OsEngine. Видео
В этом выпуске рассказываем, почему наша компания уже более пяти лет находится в Краснодарском крае, а не в столице или за рубежом. Обсудим, как и...
Обновление кредитных рейтингов в ВДО и розничных облигациях (АО «Нэппи Клаб» понижен до ruC)
🔴АО «Нэппи Клаб» Эксперт РА понизило рейтинг кредитоспособности до уровня ruC, прогноз по рейтингу развивающийся. По рейтингу установлен...
Фото
Народный портфель. Норникель снова заменил Роснефть
Московская биржа опубликовала данные о «Народном портфеле» на конец 2025 г. Рассмотрим, какие бумаги были популярны у российских частных...
Фото
Обзор данных Росстата по выработке электроэнергии в РФ в ноябре 2025г. и по потреблению энергии в декабре 2025г.
Росстат представил данные по выработке электроэнергии в РФ в ноябре 2025г.: 👉выработка электроэнергии в РФ — 104,59 млрд кВт*ч. ( -2,69%...

теги блога Replikant_mih

....все тэги



UPDONW
Новый дизайн