Олег Иванов,
Ну у меня в одну древнюю RTX 3060 12GB gpt-oss-120B помещался. Этож moe. Квантованная конечно, но пристойно. Размер на диске и в ОЗУ ок. 60GB. А эта gpt-oss-120B вовсе не лошковая модель. В математике шарит сильно больше меня.
«Чем дивергенция Кульбака-Лейблера отличается от метрики Вассерштейна?»
Очень бойко отвечает страниц пять текста с красивыми формулами. И это при том, что я в вопросе Вассерштейна Вассерманом обозвал.

