Избранное трейдера Press
Ходил я тут на собеседование в один банк, на позицию, связанную с data science. Собеседовался с их главным Data Scientist.
Мужик раньше работал в академической среде. Судя по его вопросам, на которые я часто не знал ответа (а иногда — не совсем даже понимал термины, которые он использовал) — мужик знает статистику и машинное обучение досконально.
Из одних его вопросов я понял, как мало знаю и в каких направлениях предстоит копать. Хорошо, что на некоторые хотя бы вопросы я смог достойно ответить.
Оказалось, что он брат-славянин. Не из России, но близко.
У него было почему-то очень высокое мнение о знаниях россиянами фундаментальной математики. Короче, разоткровенничались на этой почве.
Пообщались хорошо, душевно. Я с ним поделился своими попытками построить торговую систему на основе ML. Он сказал, что у него лично есть прибыльная торговая система, торгующая драгметаллами и валютами, которая делает ему столько денег, что в банке он продолжает работать чисто для души и интереса.
Начало здесь.
Зависит ли корреляция сигналов от оборачиваемости?
Если мы проведем параллель между сигналами и акциями, то оборачиваемость по каждому альфа-сигналу является аналогом ликвидности акций, которая обычно измеряется через средний дневной объем торгов (ADDV). Логарифм ADDV обычно используется как фактор риска в многофакторных моделях для аппроксимации ковариации матричной структуры портфеля ценных бумаг, чье назначение заключается в моделировании вне-диагональных элементов ковариационной матрицы, то есть структуры парных корреляций. Следуя этой аналогии, мы можем задать вопрос, может ли оборачиваемость – или точнее ее логарифм – объяснить корреляции альфа-сигналов? Очевидно, что примененение оборачиваемости напрямую (в отличие от логарифма) ничего не даст из-за чрезвычайно искаженного (грубо логарифмически нормального) распределения оборота (см. рисунок в заглавии).
Верхний график — кривая доходности по сделкам. Нижний — по дням. Основные показатели системы:
sum — итоговая сумма системы в процентах;
count — количество сделок (дней);
mean — средняя сделка (день) в процентах;
pf — профит-фактор всех сделок (дней);
wl — отношение кол-ва прибыльных к кол-ву убыточных сделок (дней);
mindd — наихудшее значение просадки по сделкам (дням) в процентах
meandd — средняя просадка по сделкам (дням) в процентам;
mindec — сумма наихудшей десятой части сделок (дней) в процентах;
maxdec — сумма наилучшей десятой части сделок (дней) в процентах;
q — качество системы как отношение средней сделки (дня) к средней просадке, этот показатель характеризует время восстановления (в сделках и в днях) счета.