Блог им. Replikant_mih

По-дружески стресс-тестим LLM

Был в игривом настроении, решил подловить ИИшку. 

По-дружески стресс-тестим LLM
По-дружески стресс-тестим LLM
По-дружески стресс-тестим LLM

Есть любители занижать оценку возможностей LLM моделей. По мне так текущие модели очень-очень бодрые на текущем уровне и очень очень полезные уже.

 

Есть такая штука как radar chart, типа такой (см. ниже), если декомпозировать интеллект на составляющие и отразить на таком графике картинку меры выраженности скиллов для среднего человека и LLM — да, они будут отличаться, и сильно, конечно. 

 

НО:
— Не факт что площадь фигуры у LLM будет, ниже, чем у человека.
— Так-то все люди между собой тоже нехило так отличаются и по выраженности разных скилов и по равномерности их выраженности и по площади фигуры.

 

По-дружески стресс-тестим LLM

360
2 комментария
|-, Какая модель не помню была, а сервис вот этот: apps.abacus.ai/chatllm
avatar

Читайте на SMART-LAB:
❓ Время Q&A – отвечаем на ваши вопросы!
Друзья, давно не общались с вами в нашей рубрике Q&A. Хотите задать вопрос команде Софтлайн? Пишите его под этим постом! 🤔 О чем спрашивать? Мы...
Фото
💸 Внеочередное общее собрание акционеров пройдет 6 мая, на повестке дня — выплата дивидендов
Как мы рассказывали ранее, мы планируем направить на выплату 2 млрд рублей, или 28,08 рубля на акцию. Чтобы акционеры могли получить дивиденды уже...
Инвестиции без спешки: торгуем в выходные
Алексей Девятов Рынок часто движется импульсами, тем важнее оценивать активы без спешки, не отвлекаясь на инфошум. Для этого отлично подходят...
Фото
Обновляем стратегию 2026: год трудный, что изменилось, и в каком направлении мы движемся?
Квартальное обновление стратегии. Стратегия Mozgovik была представлена 17 января: https://smart-lab.ru/mobile/topic/1254157/ Что остается в...

теги блога Replikant_mih

....все тэги



UPDONW
Новый дизайн