"УЗКОМУ КРУГУ ОГРАНИЧЕННЫХ ЛЮДЕЙ": Вот я придумал как оценить вероятность прибыльной работы системы на отрезке в будущем. Хотелось бы послушать критику, обсудить.
В России же много СВЕТИЛ математики, может они и здесь есть на Смарт-лабе? Особенно хотелось бы услышать А.Г.
ДАНО:
То что дано нам всегда — система которая оптимизирована на некотором отрезке — например 2007 год и работает в прибыль и имеет плавную эквити.
ТРЕБУЕТСЯ:
Определить с какой вероятностью система выйдет в плюс в 2013 году.
РЕШЕНИЕ:
1.Тестируем её (форвард тест) на 2008 году. Если система вышла в плюс значит имеем вероятность работы в прибыль в 2013 году 50%.
2.Тестируем на 2009 году. Если система вышла в плюс значит имеем вероятность 75% на 2013 год что она выйдет в плюс.
3.Тестируем на 2010 году соответственно получаем вероятность 87,5% в случае успеха.
4.Тестируем на 2011 году и соответственно получаем 93,75%
5. Тестируем на 2012 году и соответственно получаем 96,87% что она также выйдет в плюс в 2013 году.
А что такое 96% — это приличная вероятность и систему можно пускать в работу.
С другой стороны я как бы понимаю что сколько форвардов не делай вероятность 96% быть не может иначе бы все уже давно были миллионерами. Вот как только по другому это посчитать не вижу. Видимо это не возможно потому что ряды не статические.
Причем оценить размер прибыли на 2013 год это уже как бы совсем другой вопрос и нужно брать мне кажется взвешенное значение при чем сила прибыльности каждого года в общей оценке должна быть пропорциональна близости к 2013 году.
Критика этой идеи (метода оценки) приветствуется мной и поощряется плюсиками коммента и + в профиль.
Еще раз, если говорим о теории вероятности: «если 5-ть периодов подряд система дает плюс — то ожидаемая вероятность прибыльности на 6-м тесте — 96,7%.»
НЕТ! ЭТО ВЫ ТАК ДУМАЕТЕ. НА САМОМ ДЕЛЕ СИТУАЦИЯ С ТОЧНОСТЬЮ ДО НАОБОРОТ.
Это вовсе не означает, что система не может работать с вероятностью 96,7%. Это означает, что мало данных для подсчета, т.к. не было ни одного отрицательного результата :).
для справки: «ограниченный человек» — это синоним слова «дибил»…
поправили бы название топика… прям по Задорнову назвали…
— если система вышла в плюс в 2008 году, вероятность того, что она будет в плюсе в 2013 совершенно не равна 0.5. С чего вы это взяли?
В 2008 году был мегатренд вниз — это очень специфичный год.
А если система вышла в плюс 2009 году — это тоже никак не может определить вероятность поведения в 2013 году. 2009 — мегатренд вверх.
А вот если система в КАЖДОМ году дала прибыль — это говорит о том, что в 2013 году она также должна быть прибыльной, но тут уже вероятность действительно будет близкой к 1. И это потому, что все годы были разными — как трендовыми, так и с длинными унылыми боковиками. И если система выжила при всех этих состояниях рынка, то она должна пережить и 2013, ибо вряд ли он покажет что либо отличное от совокупности поведений предыдущих лет.
Про веса говорить не буду, а причины следующие — если начинать с 2008-2009 года, то там во-первых волатильность была высокая, а потому и «уловистость» системы обычно выше. Во-вторых, сейчас с рынка снимать бабосы посложнее из-за повсеместного HFT и продвинутости (обилия стратегий) крупных игроков.
Поэтому могу отослать к предыдущему посту (рост стратегий, поддерживаемых крупными игроками — немаловажный фактор!) и отсловоблудиться: Видимо, Ваша система уязвима к ММ. Надо повышать ее устойчивость.
Все уже придумано ))
Есть численный медот bootstrapping. Ваш случай это упрощенный вариант этого метода. Послушать о методе можно тут class.coursera.org/compfinance-2012-001/lecture/101
Там все описано и метод и критерии оценки…
Полно:
Положим взяли систему наугад и она 5 лет не сливает. Значит действительно маловероятно что сольет в след году P=(1/2)^5*(1-1/2)=0.0156.
А другое дело берем N систем и ищем среди них которая не сливает 5 лет или примерно равносильно изменяем параметры одной системы добиваясь чтобы не сливала. И положим нашли такую. То вероятность что не сольет в след году будет много ниже, чем если бы не подгоняли.
Пример: берем N случайных стратегий. Вероятность того, что любая из них не сольет ни разу за 5 лет P=(1/2)^5. Шанс среди N найти нужную X=1-(1-P)^N.
N=30, P=0.61
N=100, P=0.96
Итого в 100 случайных стратегий найдется нужная с вер-ю 96%. И сольет она в след году с вер-ю 1/2 (ибо случайная).
1 — рынки никогда не повторяются, во всяком случае в ТОЧНОСТИ!
2 — на рынках гораздо больше психологии, чем математики!
и первую второй описать невозможно, ибо она нелинейна и нестационарна )
по крайней мере я торгую исходя из этих посылов )
«метода» — хрень какая то. Почему первый год отхватывает 50%, а не 41,78% например… а последующие по убывающей, ваще откуда цифры?
вероятность профита =кол-во пибыльных/ кол-во убыточных.
но в постройке профитных систем большая вероятность профита еще ни о чем не говорит, она может делать +1% 150 раз а в конце сделать -100%
2 12год убивает трендовых роботов из-за рекордно низкой волатильности…
3 оценить качество бота весьма просто… сменить таймфрейм на больший меньший и протестить на всех доступных бумагах без оптимизации… должен работать в профит или хотя бы держать дродаун ниже 20%…
4 в конечном счете диверсификация решает
==== узкому кругу ОГРАНИЧЕННЫХ людей=======
зачем вам ограниченные люди? :)))
=====светила математики, А. Герчик=======
первый раз в жизни слышу что Герчик это светило математики :)))
=======1.Тестируем её (форвард тест) на 2008 году. Если система вышла в плюс значит имеем вероятность работы в прибыль в 2013 году 50%.======
если, то — вы вообще не понимаете что пишете?
действительно каша в голове неимоверная… попытайтесь для начала хоть немного осознавать и разложить знания по полочкам
А.Г. имеется ввиду Горчаков, у Герчика здесь другой ник.
про «Ограниченных» отвечал уже выше — перечитайте еще раз.
По поводу вероятностей интересна конструктивная критика.
насчет вероятностей — наверное это зависит от того, на чем построена система — если допустим просто взять какие то индикаторы и тупо подогнать под историю за несколько лет, то какой процент вероятностей в будущем выдаст система предсказать будет невозможно — кто его знает что она там выдаст? (на основе своих нескольколетних опытов с роботами могу сказать что ничего путного скорее всего не выдаст)
другое дело если алгоритм построен на вещах которые ВСЕГДА существуют ибо без них цена вообще бы не смогла ходить — в этом случае вероятность что он заработает гораздо выше 50%
Если там что то не устроит, смело записывайте меня в круг ограниченных.
ссылка на Швагера, кому интересно
заработает в 2013г — 0.5
не заработает в 2013г — 0.5
:)
Вы не правы и вот почему — то, что вы предлагаете похоже на апроксимацию какой-либо кривой полиномом (или рядом Фурье или еще чем-либо) — да легко можно подобрать параметры, так, что на 4 года, 3 года, год ваш полином будет повторять ее…
Но это не значит, что на следующем ближайшем отрезке он ее 'предскажет' ;-)))
1) оцениваем по форвардной выборке среднюю дневную доходность
2) строим для несколько доверительных интервалов, 95%, 99% и т.д.
3) выбираем интервал, где нижняя граница доходности 0
Допустим, это оказался 99% доверительный интервал. Значит, можно предположить, что вероятность убытка составляет 0.5%, а вероятность прибыли 99.5%. Но это будут долгосрочные вероятности, рассчитанные в предположении, что ТС устойчива. Если вас интересует вероятность прибыльности строго в течении года, следует спроецировать полученные на дневных интервалах оценки (среднюю, дисперсию) на годовой таймфрейм, умножив их на кол-во торговых дней в году. Дальше используем какое-либо параметрическое распределение, напр., нормальное, подставляем в него спроецированные на годовой горизонт параметры и вычисляем интересующие вероятности.
Или можно использовать Монте-Карло: «перемешиваем» множеством способов дневную динамику эквити и смотрим процент тракекторий, оказавшихся в итоге ниже нуля.
Статистика это производная от выборки. А в свою очередь вероятность является результатом оценки статистических данных. Следовательно ваш пост должен начинаться с выборки с которой вы работаете. Понятно, что с ростом вычислительных мощностей все вероятности будут стремиться к значению 50х50. Что мы и наблюдаем в основном по рынку. По мере вовлечения новых участников и их постепенному разорению мы можем утверждать, что «память» у рынка есть и следовательно мы вправе использовать бек тестинг глубина которого зависит от первого трейда до момента невозможности покрыть маржин кол этим участником.
Так же нужно понимать, что ФР в основном является сильно стохастической системой где Вероятностные модели не работают. И т.д. и т.п.
Ну вы тут сами себе противоречите сразу в двух планах:
1) стохастический это и есть вероятностный, напр., есть теория стохастический процессов
2) ваше утверждение о том что все стремится к 50х50 представляет собой некоторую вероятностную модель
Или соглашаемся с этим определением или даем свое.
Если соглашаемся, то:
1. В моем определение «в основном является сильно стохастичной...» Нужно понимать, что это не значит, что вероятностные оценки нельзя к нему применять всегда;
2. Что понятие «сильно» может выражаться количественными методами. Или мы можем говорить о снижении этой стохастичности до значений где могут быть применены вероятностные модели.
не конечны, а бесконечнечны. Вероятность 0,5% будет
сохраняться для каждого года.
Подойдём с другой стороны.
В Вашей системе Х параметров, каждый из которых
имеет некий вес влияния на систему. Косвенно можно
определить этот вес из статистики оптимизации.
Скажем ± 10% величины параметра как ухудшает результат.
Далее следует разбить год скажем на 12 участков.
Провести оптимизацию на каждом участке.
В итоге вы получите разброс колебаний каждого параметра
за год. Проанализируйте. Колебания параметров идут
вокруг некоего среднего, которое где-то близко к Вашему
оптимальному. Значит всё хорошо, корелляция есть
и Ваша модель устойчива. Если параметры «носит»
по диапазону значений хаотично или направленно,
значит Вы «одурачены случайностью».
Если Ваша система устойчива, то зачем же забегать
на 5 лет вперёд?
Можете просто брать каждый последний месяц от текущего
дня и снова смотреть оптимальные параметры.
И смотреть сохраняется ли стабильность колебаний
и не пошла ли система «в разнос».
1) Подберём параметры, при которых кривая эквити n-лет более-менее ровная (выдерживает дд).
2) Задаёмся вопросом: будет ли в следующем периоде 1/n результат удовлетворять требованиям?
Что думаю сам:
1) Не вижу связи дроби 1/n с приростом вероятности.
2) Если уж подходить с этой стороны… Допустим, лет для тестов достаточно (однозначно нужно больше, чем нашим фьючам). Строим нормальное распределение, которое отвечает на вопрос типа этого «как часто(Y) выпадает X подряд орлов/решек»… Надеюсь мысль понятна.
www.howtotrade.ru/forum3/posts/182.html