Блог им. Replikant_mih |IS/OOS 75%/25% норм? – Ага щаззз.

IS – in sample (оно же обучающая выборка), OOS — out of sample (оно же тестовая выборка). Ну или ближе к обычным алго – IS – там, где оптимизируешь стратегию, OOS – данные, которые стратегия ещё не видела.

 

 

Какое соотношение выборок лучше. Просто сейчас накапливаю некоторые данные (которые иным способом не получить), а любопытство оно же такое, что нельзя просто так взять и подождать 3 месяца и только тогда начать с данными работать, поэтому начал работать с данными чуть когда их было ещё совсем мало, потом продолжил когда их было просто мало, продолжил когда стало чуть побольше и т.д., сейчас уже вполне достаточно.

 

Из-за того, что несколько раз к данным подступался при разных объёмах этих самых данных, несколько выпятился наружу вопрос достаточности данных в целом и в частности вопрос соотношения IS/OOS в целом.

 

Когда данных совсем мало – без разницы как делить – не хватит ни чтобы обучить (терминология у меня ML’ная, но, по сути, без разницы, ML или классические алгоритмы) ни чтобы оценить.



( Читать дальше )

Блог им. Replikant_mih |ML в трейдинге, причины эффекта падения метрики качества с ростом вероятности.

К предыдущему посту с тоже конкретным ML вопросом получил отличный фидбек от толковых комментаторов, превзошло мои ожидания, очень круто, ещё раз всем спасибо! 

Уверен, что и по этому вопросу людям будет что сказать.


В общем использую ML для нахождения закономерностей в осмысленных признаках — так можно кратко описать мой подход). Так вот часто наблюдаю такие эффекты и не сформировал пока четкой позиции по их интерпретации, возможно, кто-то в эту сторону уже копал и как-то дальше продвинуться, буду рад почитать какие-то инсайты или просто рассуждения на эту тему. Добро пожаловать в комментарии опять.


Суть явления: всегда оцениваю зависимость между метрикой качества сигналов и вероятностью, выдаваемой моделью по сигналу. Хорошие признаки хорошая модель построит монотонно растущую зависимость. Может быть хаос вместо монотонного роста — значит модель не вывезла — или модель не алё, либо признаковое описание не але, либо слишком много признаков для такого кол-ва данных и т.д. Но часто даже если видно, что модель нащупала смысл в данных, начиная с какой-то вероятности наблюдаются разные явления.

( Читать дальше )

Блог им. Replikant_mih |Wealth-Lab 7, внезапно.

Иногда заглядывал на их сайт именно с идеей увидеть новости про 7-ю версию. К велсу испытываю теплые чувства. Но в процессе софтовых метаний ушел от него в свое время. Щас у меня все самописное, но щас скачал демку 7-й версии – и так приямо захотелось в уютное тепло кем-то заботливо написанного софта, а не своей хардкорной консольной инфраструктуры.

 

Ну, как минимум многоядерность новый велс заюзывает. Все падает, конечно, бета одним словом. У меня бэктесты щас векторизованные. Для приличной доли идей этого хватает, но иногда нужно старое доброе итерирование. Так что куплю как выйдет полноценная версия. Там ещё есть https://www.quantacula.com/ — кто-то юзает, что-то знает? Похоже, это тот же велс, только немного другой, в общем не понятно пока нифига.

 

....все тэги
UPDONW
Новый дизайн