Что ж, пришло время всерьез взяться за астрологию. Есть ли у нас возможность доказать ее эффективность строго математически? Это сводится к тому, чтобы доказать, что определенный набор событий (аспектов), даты которых известны, достоверно влияет на поведение цены.
Первое, что пришло мне в голову —
дисперсионный анализ. Он позволяет определить, влияет ли наличие или отсутствие некоторого фактора на исследуемую переменную. Для этого разница между средними значениями этой переменной при разных градациях фактора (факторная, или межгрупповая вариация) должна в достаточной мере превысить разницу внутри отдельных выборок при каждой градации (случайная, или внутригрупповая вариация). Отношение соответствующих дисперсий называется критерием Фишера, который, если он превосходит табличное значение, свидетельствует о значимости изучаемого фактора.
Фактором будем считать наличие точного (в пределах орба 2 градуса) аспекта между некоторой парой планет.
Градацией этого фактора примем значение аспекта: «хорошими» будем считать аспекты 120 и 0, «плохими» — 90 и 180. Таким образом, у нас будет две выборки.
Случайной величиной, которую мы исследуем, будем считать приращение цены в период действия аспекта, рассчитанное как close последнего дня периода действия минус open первого дня, деленное на open первого, т.е. относительное приращение за период. Таким образом, мы выясним, является ли влияние взаимного положения данной пары планет более весомым, чем все другие влияния в рамках каждого конкретного положения. Произведем расчет для каждой планеты в ее текущем положении на небе к каждой другой (аллюр), за исключением Луны и Меркурия, который дадут слишком большое число незначительных, не интересующих нас изменений.
Толстой горизонтальной линией посреди экрана отметим нулевое изменение цены. Штриховые линии выше и ниже отмечают ± 4%. Вертикальные линии разделяют разные пары планет. Желтыми отметками обозначены все приращения цен в случаях, когда искомый аспект имел место быть с 1 января 1990 по сей день. Красными кружками отмечены средние для каждого аспекта. Внизу в логах выдается статистическая информация и результаты расчета Фишера:
Для золота по такому анализу находится всего один достоверно значимый аспект — это Марс-Плутон. Можно видеть, что он увеличивает цену на «плохих» градусах (90 и 180) и уменьшает на «хороших» (0 и 120, все значения даны в порядке возрастания справа-налево). Такая асимметричная логика нормальна для «антирыночного» инструмента вроде золота.
Однако, для астрологов понятно, что сама идея сгрести все аспекты в две кучи — очень условна, и далеко не всегда они работают именно так, «по книжке». Если мы пройдемся по другим аспектам, то увидим, что хорошая разница есть и между их средними, но она не подчиняется этой «хороше-плохой» логике. Тогда, давайте будем считать, что все основные градусы работают независимо, и разобьем каждую пару планет на 4 градации фактора: 0, 90, 120 и 180. Мы получим 4 выборки:
Удивительно, но для золота в этом случае значимым остается опять один-единственный Марс-Плутон (сразу скажу, что для USDCHF значимых аспектов больше, но лишь на 1-2). Как мы можем трактовать полученные результаты? Они означают, что соединение и трин Марса к Плутону значимо влияет на цену золота по сравнению с квадратом и оппозицией. Для 4 выборок: каждый из 4 аспектов Марса к Плутона значимо влияет на цену относительно других. Но это не дает нам информации о том, как влияет данный аспект относительно отсутствия данного аспекта, что позволит спрогнозировать его воздействие на цену «вообще».
Для этого возьмем каждый из 4 аспектов в отдельности и сравним его с контрольной выборкой. Первое, что приходит на ум, это взять даты случайно. Но тогда мы не застрахованы от того, что некоторые из них попадут на значимые углы нашего аспекта. Лучше сравним значимые углы между каждой парой планет с традиционно «не значащами» в астрологии градусами, например 40. Теперь число наших факторов будет соответствовать всем возможным комбинациям двух планет, умноженным на 4 (число значащих аспектов). Число градаций для каждого будет 2: выборка на исследуемом аспекте, и выборка на 40 градусах. Посмотрим что вышло:
Теперь для золота нашлось целых 3 аспекта, среди которых, к примеру, Сатурн180Уран. Для желающих указать на малое число наблюдений могу отметить, что критические значения Фишера для таких выборок очень высокие, и здесь мы видим, что даже они были превышены в три раза. Если мы возьмем в качестве контрольной выборки другие «незначащие» углы, например 25 и 160, результаты несколько изменятся, и все же, некоторые аспекты останутся достоверными при всех контрольных значениях.
Но астрологам известно, что аллюрные аспекты составляют лишь малую часть предсказательного материала. Основа его — аспекты планет к значимым точкам натальных карт, или транзиты. Возьмем карту фьючерса на золото (74 год) и проведем те же расчеты с ней. Теперь мы исследуем 4 аспекта от каждой планеты к каждой значимой точке натальной карты, которых 22: 10 планет и 12 домов.
Достоверных факторов стало намного больше: для одной этой наталки их примерно 15 штук. Один из них, квадрат Солнца к 5 дому золота, представлен на рисунке. И все-таки, какой бы «незначащий» угол для контрольной выборки мы не взяли, почти всегда выборки с ним оказываются смещенными относительно 0, причем иногда настолько, что межгрупповая вариация превышает внутригрупповую лишь в силу этого смещения. Нас же интересует не столько смещение относительно какого бы то ни было другого аспекта, сколько относительно нуля, чтобы мы могли понимать, чего ждать от поведения цены на аспекте. Если посмотреть другие аспекты, можно увидеть, что даже там, где дисперсионный анализ ничего не показал, есть большое количество сильно смещенных средних. Чтобы узнать, достоверно ли их смещение относительно 0, воспользуемся
t-критерием Стьюдента. Он весьма разумно связывает его с разбросом значение от среднего (обратно) и количеством элементов выборки (прямо). Мы получим весьма приличное (несколько десятков штук) количество достоверных отклонений для разных аспектов. Оставим только те из них, которые достоверны. Вот как это выглядит:
Казалось бы, все просто прекрасно. Но можно ли считать это доказательством работы астрологии? Только при одном условии: если даты, выбранные случайно, не покажут такого изобилия достоверных отличий. Давайте предположим, что случайность равносильна тому, что мы выберем другую натальную карту, которая не имеет ничего общего с рынком золота и посмотрим число смещений на ней. Интегральным показателем, по которому можно было бы оценить «отзывчивость» цены на натальную карту, интуитивно хочется выбрать сумму модулей всех критериев стьюдента. Но в специальной литературе пишут, что t-критерий не отражает адекватно степень отклонения среднего от фиксированного значения, и лучше для этого воспользоваться самим средним. Ключевым критерием, который определит значимость карты, будем считать сумму модулей всех средних, полученных от каждого аспекта, независимо от того, был ли он t-значимым или нет.
Произведем расчет для 19 натальных карт, среди которых будут как потенциально значимые для нас объекты (фьючерс на золото, золото спот, лондонское золота, банк Англии, Федрезерв, США, доллар, ЕС, евро, Германия), так и «контрольные», среди которых карты 7 человек, никак не связанных с рынком, карта одной АТС, брокера ICE-FX и эфира :D. Сумма средних приводится не в процентах, а в чистом значении, то есть 8.0 — это 800%:
ether: сумма средних 7.43 сумма стьюдентов 171.71
icefx: сумма средних 9.28 сумма стьюдентов 338.40
mts: сумма средних 7.94 сумма стьюдентов 79.33
person7: сумма средних 7.74 сумма стьюдентов 143.67
person6: сумма средних 8.22 сумма стьюдентов 229.02
person5: сумма средних 8.31 сумма стьюдентов 103.69
person4: сумма средних 7.75 сумма стьюдентов 65.46
person3: сумма средних 7.94 сумма стьюдентов 82.15
person2: сумма средних 7.85 сумма стьюдентов 117.79
person1: сумма средних 7.93 сумма стьюдентов 147.87
ger: сумма средних 8.45 сумма стьюдентов 2779.39
euro: сумма средних 7.75 сумма стьюдентов 104.69
eu: сумма средних 7.96 сумма стьюдентов 113.86
dollar: сумма средних 8.07 сумма стьюдентов 76.57
usa: сумма средних 7.84 сумма стьюдентов 132.35
fed: сумма средних 7.99 сумма стьюдентов 68.38
bankeng: сумма средних 8.74 сумма стьюдентов 307.26
glondon: сумма средних 7.66 сумма стьюдентов 158.92
gspot: сумма средних 8.52 сумма стьюдентов 230.48
gold: сумма средних 8.45 сумма стьюдентов 179.20
Удивительно, но результат карты спот выше, чем фьючерса, а результат Банка Англии еще выше! Карты Америки дают умеренный результат, а карта Германии — отличный (откуда взялась сумма стьюдентов в две тыщщи я так до сих пор и не понял — может, очень большое число аспектов с невысокими средними?). Видно, что почти все карты людей ниже — они не дотягивают до 8. Совершенно внезапно лидером оказался Ice-fx, который, вроде, никак не связан с рынком золота.
Это, а также то, что эффективность наталок некоторых людей подбирается к нашим «специальным» наталкам, можно объяснить очень просто. При орбе в 2 градуса значимая зона для каждого аспекта составляет 4 градуса (± 2). Таким образом, она занимается 1/90 Зодиака (360 гр.) А учитывая, что всего таких аспектов для каждой карты 10 умножить на 10+12 умножить на 4 = 880, то нет ничего удивительного в том, что многие области пересекаются, и дают результат те карты, которые совсем не при чем. Тем не менее, мы видим, что целевые карты в общем и целом результативнее случайных. Чтобы окончательно в этом убедиться, создадим по-настоящему случайные выборки.
Мы возьмем одну-единственную карту (gold futures), чтобы количество и длительность аспектов по ней совпадала со «специальными». Но для каждого такого аспекта время его начала перенесем на случайную дату от 1.01.1990 до сего дня. Сгенерирум 20 таких случайных выборок:
1 сумма средних 8.34 сумма стьюдентов 1165.21
2 сумма средних 7.68 сумма стьюдентов 301.44
3 сумма средних 7.89 сумма стьюдентов 196.05
4 сумма средних 7.67 сумма стьюдентов 245.00
5 сумма средних 8.44 сумма стьюдентов 81.32
6 сумма средних 7.84 сумма стьюдентов 124.14
7 сумма средних 7.94 сумма стьюдентов 102.70
8 сумма средних 8.08 сумма стьюдентов 86.36
9 сумма средних 8.04 сумма стьюдентов 54.40
10 сумма средних 8.18 сумма стьюдентов 118.84
11 сумма средних 8.34 сумма стьюдентов 1165.21
12 сумма средних 7.68 сумма стьюдентов 301.44
13 сумма средних 7.89 сумма стьюдентов 196.05
14 сумма средних 7.67 сумма стьюдентов 245.00
15 сумма средних 8.44 сумма стьюдентов 81.32
16 сумма средних 7.84 сумма стьюдентов 124.14
17 сумма средних 7.94 сумма стьюдентов 102.70
18 сумма средних 8.08 сумма стьюдентов 86.36
19 сумма средних 8.04 сумма стьюдентов 54.40
20 сумма средних 8.18 сумма стьюдентов 118.84
Кажется, что в среднем их суммы все-таки ниже, чем сумма карты фьючерса (8.45). Чтобы убедиться в этом, применим критерий Стьюдента, который покажет, достоверно ли их среднее отличается от 8.45:
среднее случайных карт: 8.01
квадраты разности со средним: 0.1089 0.1089 0.0144 0.1156 0.1849 0.0289 0.0049 0.0049 0.0009 0.0289 0.1089 0.1089 0.0144 0.1156 0.1849 0.0289 0.0049 0.0049 0.0009 0.0289
сумма квадратов: 12.024
несмещенная дисперсия: 0.6328
t-критерий: 2.473
Сравнив его с табличным для числа степеней свободы 19 (число случаев — 1), который равен 2.093, обнаружим, что сумма нашей карты достоверно превышает случайные суммы с доверительной вероятностью 97.5%. А значит, астрология все-таки работает :D
Я с большим интересом услышу от людей, сведущих в мат.статистике, были ли совершены ошибки в этих расчетах, и, если такие есть, продолжу исследования. В противном случае этот пост можно использовать как строгое доказательство эффективности астрологии в любых дискуссиях :D
Что нужно сделать дальше:
1. Добавить затмения, вхождения в знаки и петли планет.
2. Изучить альтернативную трактовку фактора, когда мы рассматриваем время действия аспекта не как драйвер цены, а как момент переключения между разными драйверами. Таким образом, потребуется установить, достоверно ли цены на одном значении аспекта были выше/ниже, чем на другом. Сделать это будет довольно непросто, т.к. малые и средние планеты определяют лишь некоторую часть ценового движения, и между точками их аспектов могут быть более существенные сдвиги, обеспеченные другими факторами.
3. Подумать о быстрых символических методах, по которым можно собрать статистику.
4. Изучить не влияние аспектов к данной карте, а положение планет в Зодиаке само по себе относительно изменения цен. Построенная таким образом «эмпирическая карта» (в Timing Solutions это называется «фазовый зодиак») может показать более объективно, как тот или иной градус для каждой планет влияет на цену.
Следующим очевидным шагом представляется создание индикатора, который агрегирует данные со всех значимых аспектов и выводит их на график в виде стрелок, показывающих вероятное направление движения цены в момент приближающегося аспекта, а также краткую статистическую справку о его возможной величине.
Я не увидел сколько испытаний в Ваших выборках и насколько они слабозависимы и однородны Последнее подразумевает то, что приращения цен должны браться по непересекающимся временным отрезкам примерно одинаковой длины.
Ни один из отрезков в каждой выборке никак не может пересечься с другим, т.к. время действия аспекта несопоставимо меньше времени между аспектами. Длина почти всегда одинаковая, кроме случаев уменьшения скоростей вблизи разворотных точек планет, таких от общего числа не больше 5%, примерно.
А пересечение должно отсутствовать как внутри одной выборки, так и для разных выборок.
Просто для малых выборок тот же критерий Стьюдента не позволяет точно сказать чем вызвано отличие - средними или другими характеристиками распределений. А так как цены нестационарны, то при сильно разнесенных временах чаще всего и имеют разные распределения.
Просто статистика ЛОЖЬ!
Однако как наука — она практически основная в сегодняшнем мире.
И методы, которые заложены в эту науку не могут отвечать за исследователя, который исследует величины, не подходящие по критериям для самого исследования.
Если мы говорим о рыночных темах, то более применительно исследовать именно динамические ряды методами…
А динамический ряд в любом случае включает в себя параметр «время». НЕ НАБОР рядов из цифр/чисел, а именно ряды значений состояния исследуемых * во времени.
А эконометрика - это подраздел матстатистики.
Просто постоянно начинаются посты и обсуждения, уходящие далеко от самого предмета исследования, целей и прочего.
А уж про методику и методологию — говорить и нечего!
Достоверность статистически верна.
Однако, она не исследует зависимость меня от времени в конкретике дней недели.
Удивительно, но вы всё-таки изволили сказать что-то, чтобы вас поняли :)
Для применения т-критерия требуются 3 качества выборки (не считая вопроса нормальности, о котором сказал А.Г.): случайность, однородность, независимость. Для анализа всей карты независимость не соблюдается, для анализа одного аспекта — на 100%, потому что все случаи приходятся на разные отрезки времени.
Однородность не была мной доказана, это так. Но это можно сделать, изучив коэффициенты вариации, и, если надо, скорректировав выборки.
Самый интересный момент — случайность, и тот эффект ложных факторов, о котором вы сказали. По факту, конечно, выборка не случайна, т.к. все даты следуют друг за другом примерно через равные промежутки. И потому найденные закономерности легко могут оказаться следствием одного из множества циклических явлений, влияющих на цену. Но есть одно но. Ничто не в силах влиять на астрономические явления. Влияние же их на цены является предметом этого исследования. А если так, то при случае, что будет доказана корреляция (не влияние) положения планет на цену, из неё будет логически следовать и влияние.
Соглашусь, однако, не подгонка ли данных под результат? ФАКТИЧЕСКИ, поиск данных, которые дали бы на выходе анализа ДОСТОВЕРНОСТЬ достаточную?
Поможет ли математика СТАТИСТИКЕ?
Даже подгонять ничего не надо… при подобных статистических исследованиях оба ряда данных должны быть однотипными, принадлежащими одному классу…
Зависимость — да, выше было сказано. Для всех 880 выборок есть пересечения.
А возьмите так же температуру в крупнейшей больнице страны как динамический ряд…
сравните с температурой на улице в том же районе ...
вычисляйте… желательно с учетом сезонности ..
получите такую же достоверность…
И суть полученных данных?
Аааааа… Это наверное только потому, что они публичности не любят.
PS
Нормально я отношусь к астрологии. Нормально.
Впрочем, если вы хотите оказаться в списке форбс, вам, вероятно, следует заниматься чем-то другим. Ну а я здесь и вовсе туда не мечу, просто ковыряюсь пальцем в истине да провоцирую биржевиков :D
Я публичности избегаю. И плюс я шибко эмоциональная.
Периодически спорю, с рынком, до хрипоты.
Но многие ведь курят. Так и я. Не курю, но спорю с рынком.
У каждого свои вредные привычки.
B-)
с двумя рядами:
1. день недели
2. как прошли у меня «пятница/суббота»...
Достоверность статистическими методами будет на уровне 99%. ЗА ЛЮБОЙ ПЕРИОД.
Где геометрия, позвольте спросить!!!
Это же так просто.
И при гомогенности всех исследуемых величин по влиянию фактора на них (синхронном движении всех активов). А это не так, для того и наталки.
По поводу отработки. Предполагается, что некоторые вещи можно обосновать чисто математически. Здесь меня интересовало в первую очередь это. Можно сделать и форвард-тест конечно, а публиковать прогнозы буду только если увижу стабильную эффективность сам.
Дальше. Пусть у тебя получились какие-то циклы с переменным периодом, но главное, что есть чётко определённые разворотные даты. В результате чего система показывает год стоять в лонге, потом 1,5 года в шорте, потом 14 месяцев в лонге и так далее. Разбей каждый период на 12 равных частей, возьми изменение цены, а потом просуммируй все первые, вторые и надцатые приращения. Если в результате получить синусоиду, это результат (и безо всякой сложной математики) — ещё и амплитуду сразу измеришь. Если же получишь осцилляцию… ну тогда и Фишер не поможет.
А это равносильно тому, чтобы сложить все изменения цен за один критерий, и умножить на торгуемое плечо. Если смотреть визуализации распределений, то мы увидим, что нет ни одного аспекта с числом случаев более 20, для которого все приращения цен были бы с одной стороны от нулевой линии. То есть в любом случае будут потери. Но, с одной стороны, смещения средних некоторых из них очень значительны, и, подозреваю, останутся достоверны даже после проверки на однородность, а с другой — малочисленные аспекты, в которых приращения располагаются почти полностью по одну сторону от нулевой линии, содержат число случаев в несколько раз большее, чем то, на основании которого фундаментальные аналитики делают выводы о будущем по прошлому, «которое уже случалось так целых три раза, и потому, видимо, повторится вновь».
«Разбей каждый период на 12 равных частей, возьми изменение цены, а потом просуммируй все первые, вторые и надцатые приращения. Если в результате получить синусоиду, это результат (и безо всякой сложной математики) — ещё и амплитуду сразу измеришь. Если же получишь осцилляцию… ну тогда и Фишер не поможет.»
А вот это очень интересная идея, но для нее нужна как раз иная логика: та, что указана мной в п.2 «что делать дальше». В данный момент факторы рассматриваются как действующие ограниченный отрезок времени. Кроме того, чтобы сделать экспертную систему, которая выдаст лонг/шорт, потребуется уже неким образом синтезировать найденные данные, а это вторая сторона медали. А вообще идея хорошая. Качество предсказательности можно будет оценивать по степени гармоничности осцилляций.
Периоды все фиксированные, просто сочетаний много.
Эмпирические циклы Вуда и проч. — совсем не то же, что астрология.