yurikon, создает с нуля (в промпте есть примеры чувствительных мест, особенно то что касается доступа к данным). Но если задача завершается неуспешно — делает несколько попыток исправить код, используя сам код и логи с ошибками
__rtx, по моделькам — мы пробовали файнтюнить разный опенсорс и сравнивать с коммерческими моделями (опенаи, антропик) — получалось что для финансового домена сырые опенсорс совсем плохо (у нас есть батарея тестов), после файнтюнинга — чуть-чуть похуже коммерческих. Почти на уровне, но чуть-чуть похуже. Так что в основном используем коммерческие модельки. На самом деле они совсем не дорого выходят. А опенсорс (всякий oss120 к примеру) — для небольших утилитарных задач, к примеру классификация и тп, для которых их точно достаточно.
Synthetic, Не для того создавался, вы серьезно? Мне вообще полностью параллельно для чего он создавался. Мне нужна информация в нем содержащаяся. Были бы вайперперы на бересте — мы бы распознавали OCR и клали в базу.
Synthetic, pdf парсятся, кладутся в базу, формируются эмбеддинги. Дальше как обычно — cosine similarity к задаче которую написал пользователь (ну или к областям аномалий если мы говорим про полностью автоматическую генерацию). Ну и дальше топ несколько (не помню сходу сколько, надо лезть смотреть, то ли 5 то ли 10) наиболее близких статей подаются как доп. контекст к задаче пользователя.
Synthetic, посмотрите по комментам. Не буду повторяться чем я занимаюсь. Бумажек уж несколько тысяч за 15 лет точно перечитал. А вы путаете подход (численный анализ) и таймфрейм. Страшная правда — но аномалии могут быть и в микросекундах и в месячных и годовых таймфреймах (к примеру всякие там динамические факторные модели для макро). Нет, я конечно понимаю обидно понимать что через несколько лет Вас заменят модельки… Но не делайте на этом основании прогнозов о чужом жизненном пути :).
__rtx, слушайте, я не очень понимаю о чем вы… Обычный цикл прототипирования — тестирования у кванта дни-недели. Тут полчаса — час. Причем доля приемлимых результатов сравнима. Конечно сырой вариант и от кванта и от моделек в торговлю никто не пускает. Но сравнение скорости-качества — в пользу моделек. А уникальных и гениальных квантов — ну прям сильно сильно поискать.
Replikant_mih, ага, про набор примитивов все так. Мы пока так не сделали (условно говоря можно давать готовые функции для повышения качества), но в планах. В целом применимость может быть разной — там хоть руками поправь готовый код если кажется что медленно или неправильно(или напиши это сделать в диалоге модели — это сейчас доделывается) — и заново нажми ретест. Или можно засунуть в запрос вайтпейпер и попросить сделать стратку по ней. Сейчас из того с чем столкнулись в плане проблем — не очень хорошо получаются стратегии с ML. Но там понятно — тот же тензорфло запаришься засовывать в каждый докерфайл.. Да и логика тестирование — валидация — тоже как правило сложнее какой-то обычной новостной или фундаментальной стратегии. Ну то есть он пытается что-то делать — но доля успешных задач в таких случаях ниже. Но иногда прикольно получается - даешь статью с какой-нибудь сложной конфигурацией сеток — он ее утилизирует до какой-то обычной регрессии. Сохраняя общую логику — фичи там и тп. И вполне торгуемо получается иногда:).
Replikant_mih, я в хедж фонде работаю :). Это мы как внутреннюю историю делали, но в принципе под какой-то паблик заточить — было дело дня, поэтому тоже сделали посмотреть вдруг кому будет как продукт интересно.
Replikant_mih, Спасибо! Модель сама пишет бэктестер. Для доступа к данным ей (вернее им — там кодер, несколько валидаторов и еще дополнительная логика ретраев) даем детальное описание таблиц и примеры запросов — MCP не разворачивали так как это все крутится в одном окружении, хотелось бы лэтенси не растить. На дневках в принципе пофиг, но с минутками и ниже уже будет чувствоваться. Код который получился -запускается отдельной задачей в авс, ну и потом артефакты в базу и с3.
ВВШ Free.Solo., ну это примерно как с человеком. В среднем доля удобоваримого будет как у обычного среднего кванта. Поверьте, мне есть с чем сравнивать.