Не подумайте плохого в части нормальности, речь пойдет не о психиатрии, а об известном в теории вероятностей нормальном распределении
А точнее даже не о нем самом, а об известной центральной предельной теореме (ЦПТ) применительно к ценам. Что такое центральная предельная теорема в ее классическом виде?
Пусть нам дана некоторая сумма большого числа случайных величин Х=х1+…+хN где каждое слагаемое имеет конечную и ненулевую дисперсию (как мы увидим далее в приложении к ценам это условие выполняется). Человечество давно еще с 18 века (Муавр и Лаплас) заинтересовал вопрос распределения случайной величины Х или хотя бы его более-менее точного приближения.
Не будем слишком строги в определениях всяких сходимостей и их скоростей, а сформулируем классическую ЦПТ в виде интуитивно понятного, но нестрогого термина «близости». Так вот, если xi – независимы (кто хочет может посмотреть строгое определение независимости, а для менее пытливых скажу только, что корреляция двух независимых случайных величин с конечными дисперсиями – нуль, хотя и обратное не верно), то распределение Х при достаточно больших N практически не отличается от нормального распределения со средним А и дисперсией D, где А – сумма средних x i, а D – сумма дисперсий тех же величин. Так как дисперсии конечны и не нулевые, то существуют две положительных константы C1<C2 такие, что для любого i дисперсия хi лежит в интервале [C1;C2], а для D имеет место неравенство C1N≤D≤C2N.
А вот последнее неравенство, из-за которого и появилось в названии теоремы прилагательное «центральная», приводит нас к достаточно интересной задаче, будоражащей умы специалистов в теорвере.
В 20 веке со времен появления цепей Маркова человечество озаботилось аналогичной задачей приближения и для случая зависимых случайных величин. Было придумано несколько видов зависимостей, для которых ЦПТ тоже верна. Например, она верна для известной модели Бокса-Дженкинса в наиболее интересных с точки зрения практики случаев. Но для всех таких случаев для дисперсии Х выполняется упомянутое выше неравенство C1N≤D≤C2N, правда, с менее четко определяемыми константами C1 и C2.
Это, с одной стороны. С другой, для случаев, когда D=CNk, где k не равно единице, есть куча теорем, когда распределение X близко к совсем другому распределению, а не нормальному. И даже доказывается, что если «близкое» распределение вообще существует, то нормальным оно не будет. А вот для «центральной» области, т. е. D=CN есть только примеры, когда никакого близкого распределения не существует (или по научному нет сходимости), а все доказанные случаи сходимости только о сходимости к нормальному распределению.
И возникает естественный вопрос о верности гипотезы:
Если распределение Х сходится с ростом N к некоторому распределению и C1N≤D≤C2N, то это распределение нормально.
Увы, ее никто не доказал и не опроверг. И целью этой заметки не является обсуждение путей ее решения.
А цель другая: обратить внимание на условие и C1N≤D≤C2N. Что такое дисперсия X в общем случаев? Это сумма дисперсий слагаемых плюс сумма попарных ковариаций слагаемых. Понятно, что первая величина в силу конечности и ненулевости дисперсий принадлежит «центральной» области. А что со второй? Так как дисперсии конечны, то существует положительная константа С такая, что дисперсия любого слагаемого меньше С. Давайте разделим эту сумму на С и разобьем на три слагаемых: с отрицательными ковариациями, с положительными и с нулевыми. Ну последние нас не интересуют. А что можно сказать про две других? А то, что первая по модулю меньше модуля суммы всех отрицательных попарных корреляций слагаемых, а вторая просто меньше суммы всех попарных положительных корреляций.
И что же тогда представляет из себя случай выхода дисперсии за центральную область, т. е. D=CNk, где k не равно единице? А очень просто:
Если k<1, то среди слагаемых подавляющее большинство отрицательно коррелированы между собой и наоборот, если k>1, то среди слагаемых подавляющее большинство положительно коррелированы между собой. Но мы помним, что у независимых случайных величин корреляция нулевая, а значит в обоих случаях k не равного единице, подавляющее большинство слагаемых зависимо между собой.
И какое это имеет отношение к рынку и ценам? А очень простое. Пусть хi – это приращение одного тика цены. Если это ликвидный инструмент, то сколько может быть тик внутри дня? Ну 5, максимум 10 шагов цены. Значит его дисперсия точно конечна.
А что такое X? Тоже просто – это приращение цены за N тиков. И когда при больших N Х точно может быть только не нормальным? Если среди тиков подавляющее большинство положительно (отрицательно) коррелированы между собой, т. е. зависимы. А что означает зависимость тиков в разные порой далекие моменты времени? А то, что по крайней мере один из участников тика замыслил это действие во взаимосвязи с большинством других тиков и также действует один из участников большинства других тиков, т. е. существует достаточно «денежная» группа участников, которые не борятся между собой за «кусок пирога», а «дуют в одну дуду».
Ну допустим, что N – это тики с открытия торгов до закрытия и рассмотрим уже Х по дням. И что же тогда, вероятней всего, означает гипотеза о ненормальности Х для почти всех дней. А то, что из-зо дня в день рынком, например, SPY «кукловодит» какая-то группа очень денежных лиц, хотя и в разные дни это могут быть и разные группы, сменяющие друг друга.
Вы верите, что на SPY такое возможно? Лично я не верю. Но вера – это уже недоказуемо.
А как же тяжелые «хвосты» в выборочном(!) распределении X по тем же дням, спросит «продвинутый» читатель? А вот это очень просто. Разве N в разные дни одинаково? А значит никто и не гарантирует стационарности дисперсии нормального закона. Это как минимум. А ведь есть еще и среднее, равное сумме средних тиков. А оно то уж точно разное в спокойные дни и в такие, как 3 марта 2014 или 9 апреля 2018, хотя бы потому что совершенно разные люди в такие дни приходят к одним действиям независимо друг от друга, но под влиянием одиночной внешней новости, т. е. их средние начинают иметь один знак, хотя и корреляции по прежнему нулевые (методы то разные).
Ну то в америке нормальность, а у нас то точно «кукловодство» — есть такое мнение. А вот и нет. Если «померяться хвостами», то получится, что «наши хвосты» в ликвидных инструментах только пропорционально крупнее, а по виду точь-в-точь как и в штатах. А это значит либо и там и там «кукловодят», либо ни там, ни там. Ну и вопрос выбора между «и-и» и «ни-ни» опять же вопрос веры. Это любой третий вариант – нонсенс и уже ненормальность не в вероятностном смысле.
Как то так не слишком строго и почти без формул «доказывается» то, что приращения цен на больших таймфремах нестационарно нормальны. А на малых вообще то ограничены. И потому никаких подобий между разными таймфреймами нет и быть не может. А что это означает? А то, что с «одним аршином» к пятиминуткам и дневкам подходить надо с очень большой осторожностью и с недоверием относиться к тем, кто формулирует это в качестве аксиомы.
PS. Дополню тем, что написал в комментарии: важный гносеологический вывод: если мы строим методы торговли по прошлым дневкам или даже часовикам (если в часах много тиков), то «копать глубже» функций второй степени нелинейности от приращений цен или приращений логарифмов цен (цены в тексте легко меняются на логарифмы цен без потери сути) бессмысленно.
Жаль что я дуб в математике.
вообще еслиб на рынке было нормальное распределение то все озолотились бы легко
вообще не надо изобретать велосипед… есть целые разделы математики посвященной теме радиолокации и обнаружении сигналов на фоне помех(случайных процессов)
Интересно, а за чей счет, если все?
09.04.2018 кукл лишь на нашем рынке кукловодил, а америка росла в это время
Тема отличная, спасибо! было оч интересно почитать (правда них-я не понятно, но все же).
Логика подсказывает, что рынок имеет ограниченный объем ликвидности внутри дня, поэтому логично, что объем который можно, условно «выкупить» за сутки, не равен объему за 5 минут. Не только по технической, но и по человеческой причине (не так быстро принимаются решения, проволочки, а согласуй с босами хедж фонда и т.д.).
Но за пост люто плюсую. Пишите еще!
А «теорема Ферма» в том смысле, что это очень просто сформулированная, но недоказанная гипотеза.
Так доказали лет 30 назад
ru.wikipedia.org/wiki/Великая_теорема_Ферма
Лучше быть вот таким вот старичком-боровичком
Типа это вообще одна и та же жизнь прямо))
Нам с тобой точно не по пути, если ты восторгаешься такими вот как гриша))
Быстрые таймфреймы не тождественны медленным хотя бы из-за суточной и недельной цикличности.
Любая мера изменчивости цен дает нестационарную статистику.
Типа, да. И чё?
Я рискнул бы предположить, что все сводится к тому, что паттерны на таймфрейме «день» не могут быть применимы к паттернам на «час».
А между прочим, многие сторонники «Фибоначчи и КО» и прочие гуру ТА в каждом своем опусе роняют фразу «а теперь опустимся на таймфрейм ниже и увидим что график повторяет ту же фигуру» — а он нифига не повторяет. Это жажда мозга найти совпадение, не более.
А уже доказано, что они зависимы? Во всём, что мне приходилось читать, как раз утверждалось обратное. Цена подчиняется Марковскому процессу, т.е. «будущее» процесса не зависит от «прошлого» при известном «настоящем».
www.youtube.com/watch?v=oXtjhFCy3js
У Вас в прошлом были ценные (imho) мысли, но Вы их не развили (не сумели, не озвучили, ...) и предпочитаете повторяться.
"... подходить надо с очень большой осторожностью и с недоверием относит?ся к тем, кто формулирует это в качестве аксиомы."
Medice, cura te ipsum!
И хотелось бы пруфов схожести с американскими хвостами
А. Г.,
Как говорил Станиславский, хочу прочитать ваш топик на эту тему...
Меня понятно смущают предварительные подготовительные процедуры.
Я где-то читал есть преобразование, которое любые данные делает почти нормальными.
ПС Комментарии про алкоголь хотелось бы выпилить, конечно. Портят годный контент.
P.S. Комментарии про алкоголь не могут портить годный контент. Они лишь добавляют контенту необходимое послевкусие.
Мне нужны пятиминутки, надо проверить кое-что, просто…
И да..
Сигма вроде средне квадратичное отклонение. А Как сигма превратилась в дисперсию? Корень забыли на рисунке? или квадрат?
Насчет ТРИЗА спорить не буду, хорошая штука для инженерной практики. У нас я пока пользы от него не ощутил.
Поэтому я, ошибочно, подумал, что у Вас есть какая-то мера нелинейности.
фактически формулируется ограниченность тиков, но не стационарность. Понятно, что ограниченность случайной величины более сильное условие, чем ограниченность дисперсии.
Вы некорректно постулировали ограниченность разности цен между двумя тиками.
Возьмите и постройте гистограмму приращений на тиковом ТФ. Там такие хвосты будут что мало не покажется.
и ты такой стоишь и думаешь, вроде ведь всё правильно. но чувство что где-то тебя слегка обманули, почему-то не покидает.
вот с тервером у меня почему-то изначально так.
даже вот учебник купил. стал читать как понятие «вероятность» определяется. и опять загрустил.
ну бывает так.
модели можно строить, нужно строить. никак без них. главное чтоб работали :)
спасибо за пост!
Итог-то один: ненормальность закона распределения на микротаймфрейме благополучно кочует во все старшие таймфреймы.
А когда Вы говорите, что «на интервале Лет, пятилеток и десятилетий закон распределения нормален», то это только потому, что у Вас маленькая выборка и в ней просто недостаточная статистика на хвостах.
Золотые слова.
Странно, но маленькая выборка не может опровергнуть закон, как впрочем и подтвердить его.
И «кочует» не ненормальность, а только нестационарность. Тики то вообще ограничены, у них нет «хвостов».
А практическая суть моего поста не в нормальности-ненормальности, а в выделенном тексте и PS, следующих из нормальности.
Мы видим фигню, которая не является гауссом, но Вы вместо признания этого факта начинаете придумывать монстрячные конструкции и называть их «нестационарный гаусс».
Это нехорошо. Принцип Оккама призывает нас упрощать ситуации и называть кошку кошкой, а не собакой с небольшими изменениями в экстерьере.
Иначе я тоже могу взять процесс типа N( 10000*sin(t); 0.0001) и буду всех уверять, что «это тоже нормальное распределение, просто немного нестационарное».
Это будет утвержденип из разряда «человек может прожить на 3500 руб в месяц».
Он без труда померяет дисперсию. И только среднее будет иногда корчиться и уползать ИНОГДА за свой доверительный интервал.
И вообще Ваш пример противоречит топику, так как для дисперсии имеет место неравенство C1N≤D≤C2N, а среднее не больше СN. Причем все С малы по сравнению с N. Иначе ЦПТ не действует.
И тяжелые хвосты никуда не деваются.
Причины можете сами придумывать: что нужно сломать в постулатах, чтобы теорема не сработала.
Строим гистограмму приращения логарифмов на любом интервале. Невооруженным глазом с тестом нормальности видим, что это НЕ ГАУСС.
Это даже Кибор уже проделал (и, видимо, успешно защитился после этого.
Рассуждения про «негауссов гаусс» несостоятельны. Это просто Ваш личный эвфемизм с попыткой подменить понятия.
Но Вы по-прежнему упорствуете и говорите что цпт работает и на большом интервале все становится гауссом?..
Кажется, Вас теперь двое таких Истинно Верующих из секты Святого Гаусса на С-Л. Буду знать.
А. Г., Вы приводите в пример монстрячное распределение (Леви или, допустим, GHD), которое даже в названии не содержит слово «нормальное» и говорите: "О! Там где-то в кишках во втором абзаце 500-страничной книги мелькнуло e^(-x^2). Я же говорил, что рынок описывается нормальным распределением!"
Может быть Вы лично для себя понимаете разницу. Но вот когда Вы начинаете закидывать этот тезис в публичное пространство, получается преднамеренное введение этой самой публики в заблуждение.
Собственно, уже все сказал что хотел.
GH — частный случай такого распределения и не более того. Но зато «отсекаем» все теории о наличии двух разных распределений в приращениях цен.
моё мнение по поводу вывода:
2-я волна важнее 1-й волны
или другими терминами
2-й период важнее 1-го периода
зато 3-ю волну или 3-й период ловить безсмысленно
о чём есть ряд моих тем и море сообщений
на дюжине форумов и здесь видел единомышленника
ИМХО из неё следует один важный практический вывод. Уменьшая торговую часть и одновременно увеличивая количество сделок можно существенно снизить риски при заданной доходности (эквити выпрямляется). Но это работает до определенного предела, слишком уж сильное мельчение начинает давать противоположный эффект. И дабы определить оптимум приходится анализировать средние величины свечек, сигмы и др.
А вообще затронутая тема очень пересекается с темой Гнома — попытка моделирования эффекта продажи опционного края (взять премию) путем отработки волатильности БА при движения БА. Т.е. по сути Ваша статья дает направление, где копать по поводу мат.аппарата.
наше лучшее знание о будущем — это набор событий с некоторыми шансами их появления, как минимум два из которых ненулевые.
Математически доказать существование случайности невозможно.
Попытка формализовать рынок в той или иной степени напоминает пример с Демоном Лапласа и когда псевдоученые, даже получившие нобелевскую премию об этом забывают, случаются катастрофы.
Мое мнение, что распределения на рынке меняются, и для каждого инструмента свои и каждый опытный трейдер видит их по своему и соответственно прикидывает шансы на сделку. Рынок это такой бурлящий океан распределений.
А сколько заработал — это очень сильно зависит от начального капитала. Я уже писал, что рублевым миллионером на рынке становился трижды, стартуя с сумм в разы меньше, потому что ранее заработанные миллионы приходилось тратить на недвижимость для детей и прочие «радости жизни». А вот шанс заработать крупные премии на управлении крупными суммами под миллиард рублей мне либо внешние обстоятельства не дали (в 2008 на панике в ноябре босс вывел деньги из России), либо «дохлый» рынок, как в 2010-2013. Поэтому хорошие премии в несколько миллионов рублей я получал на меньших суммах.
Идея приближать цену гауссовскими процессами кажется весьма разумной. Но применима ли ЦПТ для обоснования? Например, наличие гэпов может говорить о бесконечности дисперсий некоторых xi или, хотя бы, о быстром росте ограничивающей их в совокупности константы с ростом N.
Мне кажется что обоснования гауссовости можно найти, но они будут гораздо «слабее» чем ЦПТ. Например, похоже что эмпирическое распределение приращений цен (или их логарифмов) можно приближать смесью нормальных распределений.
PS: По сути, в ваших лекциях говорится об этом.
А смесь нормальных распределений, как одномерное распределение процесса, возникает, например, в нестационарных процессах, каждых из элементов которого распределен нормально, но со случайным средним и дисперсией. В этом случае мы получим распределение из класса обобщенных гиперболических. А он достаточно широк и включает, в-частности, такие распределения, как Стьюдента, Лапласа, экспоненциальное, инверсное нормальное и кучу других, не имеющих названия. Только Пуассон и Парето «мимо кассы».
Причиной могут быть последовательности однонаправленных сделок, возникающих у крупных игроков при пересмотре их портфелей. А поскольку есть тенденция укрупнения крупных игроков (пенсионных фондов, например), то и подобные последовательности сделок будут расти, увеличивая верхнюю границу для дисперсии со временем.
А «толстые хвосты» могут быть просто порождением нестационарности, как дисперсии, так и среднего (однонапраленное движение и является ничем иным, как смещением среднего приращения). Ведь смесь нормальных распределений со случайными средним и дисперсией — это обобщенное гиперболическое распределение. А частным случаем этого класса являются и распределение Стьюдента, и экспонециальное распределение и еще куча других с полиномиальным или экспоненциальным (без квадрата) убыванием «хвостов».
Если же речь о барах, то однонаправленные серии сделок, скорее всего, имеют случайное направление, длину и случайно накладываются друг на друга и случайно же разделяются между соседними барами. Вряд ли они при этом образуют детерминированный тренд среднего, скорее уж — волнообразный тренд дисперсии. При этом волны дисперсии посчитанные на истории, скорее всего, являются сильно сглаженной версией волн «истинной» дисперсии.
Если посмотреть в википедию
там есть примечание """… ни одно из слагаемых не доминирует, не вносит в сумму определяющего вклада)...""" для распределений с тяжелым хвостом это условие не выполняется.
Само определение тяжелых хвостов — это распределения где отдельные слагаемые вносят непропорционально значительный вклад в суммы.
Сумма таких распределений не подчиняется ЦПТ и не сходится к нормальному.
И даже их собственные параметры, такие как среднее и дисперсия не стабильны и не сходятся.
Это можно посмотреть на графике, если задать распределение с тяжелым хвостом, и построить среднее по оси Y, и как оно меняется при добавлении каждого нового случ. значения, охь Х расмер сэмпла. На графике вместо плавной сходимости будут прыжки.
Точнее, ЦПТ для таких случаев тоже вроде работает, но требует астрономических размеров сэмпла, на порядки больше данных чем доступно на практике.