Гуру Хренов, вот и я работал и работаю. Подходов много, включая re-ranking при помощи LLM, но даже на глубоко структурированной информации в JSON/JSONL получить реальные результаты на мало мальски серьезных датасетах в сотни мегабайт невозможно. В разы проще оказалось захардкодить все и получить гарантированно точный повторяемый результат, потом уж можно и в LLMку засунуть «для форсу бандитского», если клиенту уж очень хочется чтобы все было AI-like. Короче — сыро это все, очень сыро и слишком много хайпа для такого уровня сырости.
Гуру Хренов, а вы реально с RAG когда-то работали? Там все только на словах хорошо, в реальности пшик. Сначала чанкинг изуродует данные, потом по запросу векторная БД выдаст вместо 1500 реальных результатов 15-20 чанков из которых LLM попытается восстановить относительно правдоподобный контент. Результат — обычно Ад и Израиль для любой сферы с большими датасетами и требованиями к точности и полноте ответов. ИИ в настоящий момент — это единственная технологическая отрасль в которой маркетингового хайпа на порядки больше, чем реальных технологий.
Гуру Хренов, LSV, это уже личное, это твои с Трампом дела ))) Никто тебя за это не осуждает, да и кто мы такие, чтобы тебя осуждать в твоих пристрастиях ))))))))) Совет да любовь тебе и Трампу)))))))))))