Комментарии к постам Stagirit

Мои комментарии:в блогах в форуме
Ответы мне:в блогах в форуме
Все комментарии: к моим постам
yurikon, создает с нуля (в промпте есть примеры чувствительных мест, особенно то что касается доступа к данным). Но если задача завершается неуспешно — делает несколько попыток исправить код, используя сам код и логи с ошибками
avatar
  • 27 ноября 2025, 11:48
  • Еще

ИИ каждый раз с нуля создает код для бэктеста гипотезы либо использует какой-то каркас затюненный вами ранее?

Просто по своему опыту требуется еще несколько итераций, чтобы даже представить итоговые результаты в нужном виде.

avatar
  • 27 ноября 2025, 10:46
  • Еще
__rtx, по моделькам — мы пробовали файнтюнить разный опенсорс и сравнивать с коммерческими моделями (опенаи, антропик) — получалось что для финансового домена сырые опенсорс совсем плохо (у нас есть батарея тестов), после файнтюнинга — чуть-чуть похуже коммерческих. Почти на уровне, но чуть-чуть похуже. Так что в основном используем коммерческие модельки. На самом деле они совсем не дорого выходят. А опенсорс (всякий oss120 к примеру) — для небольших утилитарных задач, к примеру классификация и тп, для которых их точно достаточно.
avatar
  • 26 ноября 2025, 20:03
  • Еще
Stagirit, 
Не для того создавался, вы серьезно?
Абсолютно. «В первую очередь предназначен для представления полиграфической продукции» для человеческих глаз.
мы бы распознавали OCR и клали в базу.
Так чего же не распознаете?
Мне нужна информация в нем содержащаяся.
И как Вы графики парсите??
avatar
  • 26 ноября 2025, 16:05
  • Еще
Synthetic, Не для того создавался, вы серьезно? Мне вообще полностью параллельно для чего он создавался. Мне нужна информация в нем содержащаяся. Были бы вайперперы на бересте — мы бы распознавали OCR и клали в базу. 
avatar
  • 26 ноября 2025, 15:22
  • Еще
Stagirit, 
 pdf парсятся, кладутся в базу, формируются эмбеддинги.
 По старинке значит… По моему скромному мнению, нет более ущербного занятия, чем парсить PDF. Этот формат не для того создавался.
avatar
  • 26 ноября 2025, 13:33
  • Еще
Synthetic, pdf парсятся, кладутся в базу, формируются эмбеддинги. Дальше как обычно  — cosine similarity к задаче которую написал пользователь (ну или к областям аномалий если мы говорим про полностью автоматическую генерацию). Ну и дальше топ несколько (не помню сходу сколько, надо лезть смотреть, то ли 5 то ли 10) наиболее близких статей подаются как доп. контекст к задаче пользователя.
avatar
  • 26 ноября 2025, 12:30
  • Еще
Stagirit, 
 посмотрите по комментам. Не буду повторяться чем я занимаюсь.
Меня особо не интересует чем Вы занимаетесь. Интересно как. Вот есть у Вас 9к папирок. Они как правило в PDF. Как и в каком виде они в контекст попадают? Каков так сказать пайплайн?
avatar
  • 26 ноября 2025, 12:24
  • Еще
Synthetic, посмотрите по комментам. Не буду повторяться чем я занимаюсь. Бумажек уж несколько тысяч за 15 лет точно перечитал. А вы путаете подход (численный анализ) и таймфрейм. Страшная правда — но аномалии могут быть и в микросекундах и в месячных и годовых таймфреймах (к примеру всякие там динамические факторные модели для макро). Нет, я конечно понимаю обидно понимать что через несколько лет Вас заменят модельки… Но не делайте на этом основании прогнозов о чужом жизненном пути :).
avatar
  • 26 ноября 2025, 12:01
  • Еще
А зачем нам ваши идеи? Вы считаете себя настолько гениальным? Мы его просто на постоянный пайплайн поставили с подачей рагом вайтпейперов. Вряд ли вы можете напридумывать больше идей чем статей в базе. 
Извините за нескромный вопрос...
Вы сами эти «вайтпейперы» то читали? Пусть не 9к, а хотя бы пару десятков? Хотя бы для того, чтоб в Вашей речи иногда проскальзывали специфические термины. Не про ML, AI, RAG, finetuning и прочие новомодные штучки, которые сейчас обсуждают даже продавцы пирожков на Киевском вокзале.
Как отвлеченный пример: Если Вы японский рисотрейдер в 1750г — «дневки» — Ваш выбор. Сегодня «квант» с «дневками» на «крипте»???  Боюсь что Ваш путь закончится на вокзале. И не факт что на Киевском.
Не воспринимайте написанное выше серьезно! Это у меня юмор такой. Сами же просили «фидбэк»)))
avatar
  • 26 ноября 2025, 10:56
  • Еще

Stagirit, 
В общем идеи точно интересные. 

Если для широких масс — это по сути ещё один скачок в сторону снижения порога для входа в алго-трейдинг. Ну по крайней мере имплементацию если причесать — чтобы этот человек не видел слова тип «докер» даже близко))).

 

Для опытного алго мне кажется, запрос ± один — убрать/упростить рутины, сократить время от идеи до готовой стратегии. Но вот у такого инструмента могут быть сложности с идеиями и реализацией за пределами небольшой сложности. Ну это как например, есть векторный бэктестер на пандас — он классный по скорости, интуитивный по пониманию, но вот список возможностей очень ограничен, и если ты не сильно выходишь за пределы логики «один индикатор пересекае другой», то тебе и норм. А если у тебя что-то посложнее в плане идей для стратегий, то ты либо не сможешь в принципе на векторные логики это перенести либо замучаешься это делать и все плюсы сведутся на нет. К чему я, думаю, тут похожая история — для простого может быть удобно — быстро, просто. А для сложного — возможно минусы от управления сложностью перетянут. Не могу без примеров) — вайб кодинг тот же — вау эффект от простого прототипа по короткому ТЗ, но при этом когда что-то сложное начинаешь пилить понимаешь, что «не всё так однозначно».

avatar
  • 25 ноября 2025, 22:05
  • Еще
__rtx, слушайте,  я не очень понимаю о чем вы… Обычный цикл прототипирования — тестирования у кванта дни-недели. Тут полчаса — час. Причем доля приемлимых результатов сравнима. Конечно сырой вариант и от кванта и от моделек в торговлю никто не пускает. Но сравнение скорости-качества — в пользу моделек. А уникальных и гениальных квантов — ну прям сильно сильно поискать.
avatar
  • 25 ноября 2025, 21:58
  • Еще
Replikant_mih, ага, про набор примитивов все так. Мы пока так не сделали (условно говоря можно давать готовые функции для повышения качества), но в планах. В целом применимость может быть разной — там хоть руками поправь готовый код если кажется что медленно или неправильно(или напиши это сделать в диалоге модели — это сейчас доделывается) — и заново нажми ретест.  Или можно засунуть в запрос вайтпейпер и попросить сделать стратку по ней.  Сейчас из того с чем столкнулись в плане проблем — не очень хорошо получаются стратегии с ML. Но там понятно — тот же тензорфло запаришься засовывать в каждый докерфайл..  Да и логика тестирование — валидация — тоже как правило сложнее какой-то обычной новостной или фундаментальной стратегии. Ну то есть он пытается что-то делать  — но доля успешных задач в таких случаях ниже. Но иногда прикольно получается -  даешь статью с какой-нибудь сложной конфигурацией сеток — он ее утилизирует до какой-то обычной регрессии. Сохраняя общую логику — фичи там и тп. И вполне торгуемо получается иногда:). 
avatar
  • 25 ноября 2025, 21:56
  • Еще

Stagirit, Круто!

Модель сама пишет под задачу себе инструмент в моменте (если я конечно, правильно понял, как это работает) — мне кажется, это будет неплохо работать на простых стратегиях, на каких-то сложные может уже буксовать ну или нет. Просто когда я вайбкодил инструменты для алго — бэктестеры и вот это вот всё, было не прям просто — то модель подсунет какую-то имплементацию в 10 раз медленней чем можно было бы, то что-то забудет, то наоборот оверинженерит и т.д. Ну хотя я по сути делал тул для большого числа задач (универсальный инструмент), с этим сложности связаны. А под узкую задачу конкретной стратегии сделать себе бэктестер в моменте — наверно это и не сложная задача. В любом случае как будто для многих стратегий модель будет делать много одинакового и тут переиспользование каких-то инструментов могло бы помочь и модели и производительности и т.д. Ну типа фреймворк ей специализированный дать — где бэктестер, где какие-то типовые обработчики, враперы для интерпретации текстовой инфы, что-то такое. И модель уже оперирует как бы набором готовых инструментов, но если надо — дописывает себе инструмент.

 

Так, поразмышлял, может я вообще не понял, как у вас это работает и мимо кассы размышлял).

avatar
  • 25 ноября 2025, 21:44
  • Еще

Stagirit, 

>> я в хедж фонде работаю

 

Класс! Не скажу, что это какая-то моя прям мечта, но всегда хотел (раньше как минимум) в хэдж-фонде поработать. Но мой набор скиллов не особо подходит для прохождения собеседования на кванта, даже если внутри мне потом было бы что предложить).

avatar
  • 25 ноября 2025, 21:37
  • Еще
Replikant_mih, я в хедж фонде работаю :). Это мы как внутреннюю историю делали, но в принципе под какой-то паблик заточить — было дело дня, поэтому тоже сделали посмотреть вдруг кому будет как продукт интересно.
avatar
  • 25 ноября 2025, 21:21
  • Еще
Replikant_mih, Спасибо! Модель сама пишет бэктестер. Для доступа к данным ей (вернее им — там кодер, несколько валидаторов и еще дополнительная логика ретраев) даем детальное описание таблиц и примеры запросов — MCP не разворачивали так как это все крутится в одном окружении, хотелось бы лэтенси не растить. На дневках в принципе пофиг, но с минутками и ниже уже будет чувствоваться. Код который получился -запускается отдельной задачей в авс, ну и потом артефакты в базу и с3.
avatar
  • 25 ноября 2025, 21:20
  • Еще
 А что у вас за… форма? В плане какая-то фирма и это её продукт или вы какое-то объединение трейдеров и т.д.?
avatar
  • 25 ноября 2025, 21:11
  • Еще

Класс! Ветерок свежих креативных идей подул. RAG над пейперами — огонь). 

У вас получается есть какие-то инструменты — бэктестер и подобные и модели их через MCP юзают или модель под стратегию сама пишет бэктестер по-быстрому и как-то и считает результаты?

avatar
  • 25 ноября 2025, 21:14
  • Еще
Rational_Capital, да, согласен. Вот на графиках я всегда вижу — тут надо было купить, тут продать :)
avatar
  • 25 ноября 2025, 20:52
  • Еще
Выберите надежного брокера, чтобы начать зарабатывать на бирже:
....все тэги
UPDONW
Новый дизайн