Статистическая значимость. Или не фигней ли вы занимаетесь?

24 мая 2019, 06:31
|
dip

Тема не только для алго трейдеров, и я пытаюсь описать все с помощью 3х математических действий, так что у вас получится дочитать ее до конца и узнать о своем трейдинге больше. Чуть-чуть.

(Картинка, для привлечения внимания и вывода на главную страницу)

Мне показалось удивительным, но ни в фин словаре Смартлаба, ни в поиске по Смартлабу, ни даже в поиске на русском языке по тредерским ресурсам, я, практически, не вижу упоминаниий способов определить статистическую значимость результатов торговой системы или готовых результатов трейдинга.

Вчера, я даже создал тему: https://smart-lab.ru/blog/540321.php для затравки. Народ нарисовал красивые картинки(спойлер: сиськи!). Но ничего не заметил. Люди тестируют торговые системы в экселе, и набирают кучу плюсов на главной. Юлия Князева сливает 40%, и только лишь потом ищет торговую систему. Но… что потом? Вот вы нашли торговую систему. Или вы Вася О., Илья К., и давно и много торгуете, и у вас есть статистика. Возможно в тетрадочке, возможно у брокера.

Вы задавались вопросом – а не случайны ли результаты вашей ситсемы? Отличимы ли от случайного результаты вашего трейдинга? А не фигню ли вы делаете ?

Несмотря на то, что мало кто об этом пишет, есть люди, которые задавались этим вопросом. Есть много страшных слов: Chi squared, p-value, Z-score(ves2010 – привет!), statistical significance, Monte Carlo (а вы смотрите Формулу 1 ?), null hypothesis итд. Не буду вас грузить деталями, и множеством оговорок, а перейду к сути:

Один из простейших способов проверить статистическую значимость ваших результатов – Chi Squared. Он же Хи Квадрат. Главное, зачем он нужен – отвергнуть так называемую нулевую гипотезу. Гипотезу — что вы – мясо. Ну, т.е вы – сливаете. Вернее даже не сливаете, а случайно блуждаете вокруг нуля. А сливают, за вас, плечи (когда их слишком много и вы не с той стороны распределения), комиссии, проскальзывания, инфляция, и… просто время (опционщики – привет!).

Итак, нулевая гипотеза гласит, что как вы не торгуйте, вы — лишь подмножетсво нормального распределения. Ну т.е. блуждаете как Ёжик в тумане. И для того, что бы доказать свою значимость, вернее значимость результатов – нужно протестироваться и отвергнуть нулевую гипотезу! Умные дяди и тети навернули кучу теории вокруг этой задачи: в общем случае у вас есть куча степеней свободы, у каждой степени свободы возможны положительные и отрицательные исходы, и каждый со своей вероятностью.

Но давайте не забывать зачем мы здесь, ок? Мы – (произностится гордо) – торгуем! И какие уж у нас исходы? Только + или -, так? Если по-простому. Причем, если мы сравниваем себя со случайным распределением, то эти + и – одинаково вероятны (ах, вы знаете про логнормальность распределения цен на рынке? Ах вы молодец! Помолчите пока). А для этого случая, критерий Хи Квадрат до безобразия прост:

Χ2 = (|a-b| — 1)^2 / (a+ b)

(здесь все должны открыть ссылку из начала статьи и пустить слезу умиления).

a – положительные исходы

b – негативные исходы.

Вот и 3 обещанных математических действия. Упс, я забыл про модуль! Вы же проходили в школе модуль ?

Еще умные дяди уже подсчитали для вас, каков должен быть этот самый Хи Квадрат, что бы быть статистически значимым. В разной степени

Выше 10.83, уровень достоверности(значимости) 99.9%
Выше 6.64, уровень достоверности(значимости) 99%
Выше 3.84, уровень достоверности(значимости) 95%

Ну, т.е ниже 95% — вы — просто мясо на рынке. Выше 99% — неплохо. 99.9% — у вас есть шансы. Есть 0.1% что вы заблуждаетесь.

Обычно, нормальному человеческому мозгу хочется примеров. Их есть у меня:

Допустим вы торговали целый год и сделали 100 трейдов. Торговали одинаковой суммой, с одинаковым тейком и стопом. 53 раза в + и 47 в минус. Ну, т.е. вы превзошли в этом году 95% тех, кто сливает на рынке. Вы — молодец. Так? Или вы делали фигню? Считаем

X2 = (53-47-1)^2/(53+47) = 5^2/100=25/100=1/4=0.25

Сравниваем с табличкой выше и… 0.25 точно меньше 3.84! Вы — блуждали!

Еще раз: 100 трейдов 70 в плюс, 30 в минус:

X2 = (70-30-1)^2/(70+30)=39^2/100 = 1521/100 = 15,21. Вы сильно выше 99.9%!

(тут пытливый ум скажет: ну ежу же ясно – прибыльных сделок намного больше, значит я – король!)

В то же время, какие типичные показатели для трендовой системы среднего пошиба? Как раз наоборот: 30 прибыльных и 70 убыточных. И на смартлабе куча примеров, что они заратывают. Как? (не знаю! где они берут такие нервы?) Ну конечно за счет больших прибыльных сделок и маленьких убыточных. Но, может они одурачены случайностью? может они случайно блуждают ?

X2 = (|30-70|-1)^2/(30+70)=39^2/100=15,21 Отнюдь!

Ну, и так далее. Пытливый ум может захотеть сказать: единица все портит. Я хфт и делаю 53000 положительных и 47000 отрицательных сделок! Что же получится? Пытливый ум может прикинуть сам, и, немного приуныть за хфт

Последняя напоминалочка: Хи Квадрат быстрый и удобный способ прикинуть значимость, но значения из таблички выше рассчитаны на то, что будет хотя бы 30 попыток (у нас это трейды, ага). Если меньше – результаты недостоверны. Но выход есть – если вы чувствуете, что ваш подход с 15 трейдами в 10 лет – это верняк (не ржите, я держу несколько таких систем!), то у вас есть несколько способов – поискать таблички в интернете, для таких бедолаг. Там есть волшебные, посчитанные значения, для случаев “менее 30 попыток”. Либо, вы можете посмотреть в сторону других инструментов, и проверить ваш верняк на них. Если он работает там, то можно попробовать суммировать попытки из разных инструментов. Но, аккуратно Проверяйте уж тогда на всех, а то вы на пути к переоптимизации Я вас не буду учить плохому!

Ну, и конечно, ваш случай может быть случаем убыточным. Но, если убедиться, что ваша убыточность статистически значима, то вы можете подумать о своем трейдинге с другой стороны: что бы иметь то, что никогда не имели, надо делать то, чего никогда не делали

А что же бедолага хфт? Тот, с 53к\47к. Или, что же бедолага имеющий 53/47 сделок, но (новое? Ключевое условие!) не одинаковых? Одурачены ли они случайностью ?

Для ответа на эти вопросы, очевидно, не достаточно знать распределение положительных и отрицательных сделок! Они что-то знают! Но это уже другая тема, НЕ про Хи Квадрат

Ключевые слова:
статистика,
алготрейдинг

4.5К | ★25

43 комментария

да на, получи ты уже свой плюсик…

Тихий омут

24 мая 2019, 07:12
Ответить

А смысл проверять статистическую значимость результатов нашего трейдинга?
Чтобы расстроиться, потерять уверенность, впасть в ступор или начать тильтовать?

Рынок сам-то имеет статистически значимые ценовые закономерности?
Если нет, то наша торговля вполне адекватна рынку. Придёт другая фаза рынка — будут другие результаты и нашего трейдинга.

Но за топик — спасибо.
Ибо, надеюсь, он напугает и оттолкнёт ещё какое-то число яйцеголовых математиков от трейдинга и от наших денежек.

Вестников (Витковский)

24 мая 2019, 07:18
Ответить

Вестников (Витковский), мне представляется, что по критерию не пройдёт ни одна заработавшая система. Иначе это был бы математически доказанный Грааль. Все систематические заработки только у рулящих рынком.

24 мая 2019, 12:46
Ответить

webmarketstat.ru/

— в помощь ))

p.s. как Вы предлагаете оцифровать эмоции? Это, собственно, и есть 95% успеха.. .

Wallstep

24 мая 2019, 07:24
Ответить

Wallstep, а точнее- их отсутствие! (эмоции).

G7 (Gone of seven)

24 мая 2019, 07:32
Ответить

Трендовики ведь не 1 к 1 торгуют, как влияет если торгуешь 1 к 10?

G7 (Gone of seven)

24 мая 2019, 07:37
Ответить

Сделок слишком мало, если ты не хфт. Ничего толком не посчитаешь. Вот тут когда-то писал как я считаю, особо ничего не изменилось: https://smart-lab.ru/blog/251938.php

То есть условно говоря каждую минуту что мы в сделке считаем «микро-сделкой», тогда нормально.

Пафос Респектыч

24 мая 2019, 08:09
Ответить

Во-первых, соотношение положительных и отрицательных исходов не говорит является ли матожидание прибыли положительным. Можно случайно делать сделки с коротким тейкпрофитом и большим стоплоссом. При нулевом матожидание прибыли получим много положительных сделлк

Roman Ivanov

24 мая 2019, 08:19
Ответить

Во вторых, если стратегия использует выходы не только по TP и SL, то все становится ещё сложнее

Roman Ivanov

24 мая 2019, 08:22
Ответить

Ну и самое главное — это эффект подгонки, который делает применение каких либо оценок качества мало полезным

Roman Ivanov

24 мая 2019, 08:23
Ответить

Позволю себе дополнить автора:

Прежде чем начинать серьёзное и трудное дело, очень полезно провести секретный индейский ритуал «Hахуа».
Он заключается в том, что индеец со всей серьезностью спрашивает себя: «Является ли данное занятие выражением глубинных устремлений моего сердца? Действительно ли я хочу именно этого? Буду ли я счастлив, когда буду делать задуманное? Испытаю ли я счастье, когда выполню всё, что задумал? Оправдаются ли мои надежды? Стоит ли эта цель средств, которые придется потратить?»
Практикуйте «Нахуа», и трудных и бесполезных дел в вашей жизни станет гораздо меньше.
https://www.inpearls.ru/

cangaroo

24 мая 2019, 08:49
Ответить

+11

Пишете грамотный пост про статанализ, а совершаете ошибку новичка: берете статистику сделок. Анализ надо проводить на временном ряде эквити, причём строить его с частотой в 2-3 раза чаще, чем среднее время в позиции, но не реже дневок. И сравнивать по соотношению «доходность-риск» надо отдельно лонги с b&h, а шорты с s&h. Кроме того, для защиты от переоптимизации не помешают критерии относительной (относительно параметров рынка) устойчивости некоторых параметров изучаемого временного ряда для разных временных интервалов.

А чем Excel то не угодил? Там при помощи VBA можно реализовать любой метод статанализа, тем более в интернете куча уже готовых и бесплатных макросов под него. Его единственный недостаток — громоздкость с т. з. загрузки компа.

А. Г.

24 мая 2019, 08:55
Ответить

А. Г., старичок, что же ты не отвечаешь за свое вранье ..??

вернись в топик

smart-lab.ru/blog/540481.php
smart-lab.ru/blog/540490.php

KostinTim

24 мая 2019, 10:19
Ответить

KostinTim,

https://smart-lab.ru/blog/540519.php#comment9750582

А. Г.

24 мая 2019, 10:27
Ответить

-1

А. Г., тупо слился Грчаков... отказался свое вранье доказывать про своего любовника КРЫСА

KostinTim

24 мая 2019, 10:35
Ответить

А. Г., я далёк от таких умных слов и математики, поэтому мало что понял из вашего комментария)) вы не могли бы объяснить что б было понятно и домохозяйке, зачем всё это, если можно просто посмотреть на «Profit per trade»… т.е. среднюю прибыль на сделку. И если она покрывает комиссию, проскальзывания и т.д. и еще что-то остаётся — значит система статистически значима и является плюсовой. Разве может быть иначе?

Леха Майтрейд

24 мая 2019, 19:23
Ответить

Леха Мартьянов (my-trade), качество торговли определяется не только точками смены позиции, но и точками, когда принималось решение о ее неизменности. А последние можно анализировать только по статистике эквити, которую я описал выше. Статистика же сделок отражает только точки смены позиций и потому не дает полной информации о качественности метода торговли. К тому же в статистике сделок легче допустить переоптимизацию.

А конечно для определения допустимого проскальзывания и, соответственно, емкости торговли достаточно статистики сделок.

А. Г.

24 мая 2019, 19:33
Ответить

Мда, какая чушь

ICWiener

24 мая 2019, 08:58
Ответить

насколько я понял, бегло ознакомившись с критерием пирсона, формула вообще неверно истолковывается тут.
в оригинале a - частота [сделки с результатом Ra] в реальной выборке
и b — частота [сделки с тем же результатом] в теоретической выборке.
т.е. или и а и б — профиты, или и а и б — лоси. а ставить в одну формулу лоси и профиты не верно.

соответственно, надо как-то моделировать эталонные случайные сделки по случайному закону, то есть нормальное распределение наиболее близкое к наблюдаемому. брать частоты и сравнивать с теми что нагенерила торговая система.

но есть ли в этом хоть какой-то смысл, если мы совершенно точно знаем, что частота лосей будет сильно больше нормальной, а пик = μ — мат ожидание, должен быть в плюсовой зоне?

что-то я лично ничего в этом красивом гуманитарном фантике не вижу.

П М

24 мая 2019, 09:54
Ответить

ПBМ, вопрос о статистической значимости положительного сдвига в эквити имеет глубокий смысл. Но критерий не вполне удачный.

SergeyJu

24 мая 2019, 11:37
Ответить

SergeyJu, отрицательного тоже )

Oerlikonium

24 мая 2019, 11:40
Ответить

oerlikon, критерий слома системы.

SergeyJu

24 мая 2019, 11:41
Ответить

SergeyJu, это будет следующая статья, видимо.

ch5oh

24 мая 2019, 11:47
Ответить

SergeyJu, мля, да просто нерелевантный. зато какая отличная перепись в плюсах экспертов матстата.
критерий вообще надо использовать в одном единственном случае — при известной ген.дисперсии и проверке H0(либо для её -дисп- оценки при заданном CL). но оригинальность метода видимо состоит в том, чтобы проверить им H0 именно относительно mean)))), не считая моментов вообще и даже не считая, че-нить типа (a+b-1)ab/(a+b)^2

flextrader

24 мая 2019, 23:45
Ответить

flextrader, у меня есть вот такая хорошая книжка:
http://alleng.org/d/math/math369.htm
масса критериев проверки всяческих гипотез. На самом деле, есть критерии для оценивания смещения, свободные от распределения, непараметрические и так далее. Критериев напридумывать можно всяких. Например, можно взять отношение суммы сделок к сумме их же модулей. А пороговые значения для такой статистики оценить по Монте-карло.

SergeyJu

25 мая 2019, 10:57
Ответить

SergeyJu, вот это ближе к трейдингу чем многое из раздела про книжки )

Пафос Респектыч

25 мая 2019, 11:01
Ответить

Пафос Респектыч, обычно применяют не те статистистики, которые соответствуют проблеме, а те, которые в институте изучали. Иногда впопад, иногда невпопад.

SergeyJu

25 мая 2019, 11:07
Ответить

SergeyJu, а если построить normal distribution по известным из реальных сделок mean и deviation (кодю я на английском), то можно ли сравнивать?

допустим у меня ООС получается пси^2 = 11 (а то и 15, если постараться), значит «я неплох»? ведь всё равно надо проверять реальностью.

цифры частот к примеру такие

вообще похоже на чит, но нету даже всплеска на уровне обрезанных лосей (67)
возможно всплеска нету потому что корзины достаточно толстые 5%

П М

25 мая 2019, 12:46
Ответить

ПBМ, Ваши цифры мне непонятны. При применении нормальной модели (как и любой другой) возникает проблема соответствия модели данным. Если не лень, можно применить к данным критерий нормальности. Можно забить на отклонения от нормальности. Новиков так делает и читатели счастливы (не все, правда). Но я предпочитаю методы, свободные от предположений о виде распределения. В нормальном случае они слабее, зато робастны.

SergeyJu

25 мая 2019, 12:53
Ответить

ПBМ, по одним только сделкам никаких выводов сделать нельзя, потому что надо сравнивать с рынком на котором торговля. Если рынок сам по себе рос, а вы торговали случайно, то сделки будут всё равно в плюс. Если падал, но вы потеряли меньше чем B&H — то это может быть всё равно очень и очень круто

Пафос Респектыч

25 мая 2019, 12:55
Ответить

Абсолютно похеру на хи квадрат и на мю овал, если годовой итог трейда с учётом налогов, комиссий и прочего обгоняет инфляцию хотя бы на 3%.

Olaf Caldmeer

24 мая 2019, 12:21
Ответить

Olaf Caldmeer, изначальный посыл в том, чтобы определить, является ли этот годовой итог результатом случайной торговли, или нет. А то один год будет похеру, а другой нет, а потом снова )

Oerlikonium

24 мая 2019, 12:49
Ответить

Допустим вы торговали целый год и сделали 100 трейдов. Торговали одинаковой суммой, с одинаковым тейком и стопом. 53 раза в + и 47 в минус. Ну, т.е. вы превзошли в этом году 95% тех, кто сливает на рынке. Вы — молодец.

Молодец, но тоже — сливала.
С учётом комиссии в описанных условиях безубыток 55/45.

24 мая 2019, 12:27
Ответить

В то же время, какие типичные показатели для трендовой системы среднего пошиба? Как раз наоборот: 30 прибыльных и 70 убыточных. И на смартлабе куча примеров, что они заратывают. Как? (не знаю! где они берут такие нервы?) Ну конечно за счет больших прибыльных сделок и маленьких убыточных. Но, может они одурачены случайностью? может они случайно блуждают ?
X2 = (|30-70|-1)^2/(30+70)=39^2/100=15,21 Отнюдь!

Ошибочное применение формулы. В условиях неравных тейков и стопов a и b приобретают иной смысл. Это уже не количества положительных и отрицательных исходов, а произведения их на соответствующий вес. Примерно говоря, (при популярных 3:1 частоты будут 1:3) 0,3*3/(0,3*3+0,7*1) =0,56 и 0,7*1/(0,3*3+0,7*1) = 0,44.
Вот 0,56 и 0,44 подставляйте.

24 мая 2019, 12:39
Ответить

То что результат статистически не значим, еще не говорит о том, что он случаен, вообще то

alewmt

24 мая 2019, 15:12
Ответить

Что-то вы совсем не правильно делаете.

В критерии должно быть отличие одного распределения от другого, «нулевого», а не разница в "+" и "-". И, соответственно, обязано учитываться EV, а у вас этого нет — только "+" и "-", безотносительно их величины.

А потом, что такое хи квадрат (никогда им не пользуюсь) — это статистика сравнения распределений(!), а не интегральных результатов. Пример — у вас есть система которая играет в околоплюс по экспоненциальному закону — вы её сравниваете с нулевым гауссом и получаете… что распределения разные! Из чего отвергаете вывод о том, что ваша система бесполезна, не смотря на то, что она действительно бесполезна.

Здесь нужно не статикой Пирсона пользоваться, а другими оценками.

Kot_Begemot

24 мая 2019, 15:51
Ответить

Kot_Begemot, +100500 ))

Oerlikonium

24 мая 2019, 17:40
Ответить

Kot_Begemot, а, да, так это же интегралы. Те всего две корзинки частот у автора, для положительных и отрицательных сделок, ну так понятнее. Завтра накидаю прогу потестить.

П М

24 мая 2019, 23:33
Ответить

ПBМ,

В статистике принято считать, что общее количество наблюдений (сумма частот) должна быть не менее 50 и ожидаемая частота в каждой градации должна быть не менее 5. Только в этом случае величина, показанная выше, будет иметь стандартное нормальное распределение.

т.е две корзины — мало. да и всё равно что-то не сходится
откуда в знаменателе второй раз +b..
сравниваю по этой статье
https://statanaliz.info/statistica/proverka-gipotez/kriterij-soglasiya-pirsona-khi-kvadrat/

П М

25 мая 2019, 07:15
Ответить

ти точно фигню делаешь

РНЕ

24 мая 2019, 16:53
Ответить

Есть сезонность, есть циклы, есть просто выжидание 10 лет под дивы)

Dachnik

24 мая 2019, 23:17
Ответить

Допустим вы торговали целый год и сделали 100 трейдов. Торговали одинаковой суммой, с одинаковым тейком и стопом. 53 раза в + и 47 в минус. Ну, т.е. вы превзошли в этом году 95% тех, кто сливает на рынке. Вы — молодец. Так? Или вы делали фигню? Считаем
X2 = (53-47-1)^2/(53+47) = 5^2/100=25/100=1/4=0.25

Не знаю случайно или намеренно, в качестве примера автор взял распределение от рулетки )) Там как раз перевес в 2,7% в пользу казино.
Получатся казино — рыночное мясо.

Valeriy Sokolov

25 мая 2019, 15:07
Ответить

Читайте на SMART-LAB:

Время возвращаться к валюте?

Относительно рубля я давно придерживаюсь логики, что, пока эксперты предрекают ему неизбежное ослабление, можно за рубль не очень...

Андрей Хохрин

07:00

Снижение военной премии в нефти: что это меняет для доллара и G10

Во второй половине понедельника – начале вторники рынки активно пересматривают премию за худший сценарий на энергетическом рынке, что цепочкой...

Артур Идиатулин (Tickmill)

16:32

⚙️ Как Займер использует ИИ в своей работе

Мы часто говорим, что наш сервис — высокотехнологичный, и это не пустые слова. Ранее мы уже рассказывали, как в Займере работают скоринг и...

Займер

15:05

Гендиректор Инарктики продал свои акции компании. Что это может значить?

Вечером в пятницу (6 марта ) вышел сущфакт о том, что Соснов Илья Геннадьевич, гендиректор Инарктики, продал свои акции компании. В нашем...

Тимофей Мартынов

11:34

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

Статистическая значимость. Или не фигней ли вы занимаетесь?

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

теги блога dip

Авторизация

Ленты

Форумы

Участники

Котировки

Акции

Календарь

Информация

Книги

Статистическая значимость. Или не фигней ли вы занимаетесь?

полезные записи за 24 часа

Лучшие записи за 24 часа

самые обсуждаемые сегодня

теги блога dip