Миллиардер из Сибири, это решается дублированием — и проверкой тоже ии.
отдают ответ двум разным моделям.
а потом каждая из этих моделей получат задачу оценить насколько похожи ответы.
если модель бредит то бред получается РАЗНЫМ.
а если по теме то более менее похожие ответы.
плюс модель которая раньше бредила получая два ответа.
сравнивает их нормально и признает что ошибалась.

