Мои шаги в сторону машинного обучения на R и немного про Si, Brent

18 апреля 2016, 13:08
Ответить

Код:

это весь алгоритм? Вы что шутите, или издеваетесь?:)

sortarray sortarray

15 апреля 2016, 23:41
Ответить

sortarray sortarray, при использовании готовых библиотек любой код становится простым ) Вся сложность скрыта.

18 апреля 2016, 13:09
Ответить

Это да. Можно все посчитать. Но как из R транслировать заявки в QUIK?

IliaM

16 апреля 2016, 00:06
Ответить

IliaM, почему именно в квик?

Андрей

16 апреля 2016, 01:26
Ответить

Андрей, Как-то так сложилось

IliaM

16 апреля 2016, 19:59
Ответить

IliaM, пока хочу просто проверить, работает ли это. Можно написать функцию на R, которая будет использовать готовую модель и сразу давать ответ в виде отчета для последней рыночной ситуации, например, в виде текстового файла. Также можно на R все это проверить, найти рабочую систему. А запрограммировать уже отдельно алгоритм под терминал.

18 апреля 2016, 13:21
Ответить

Машинное обучение это интересная и полезная штука, когда обучение строится сверху-вниз, если логически заранее известно, что точно имеется то, чему возможно обучиться. По-простому говоря, машинное обучение, это не подход, а инструментарий поиска решения. Если заранее известно, что это решение существует, то машинное обучение справится.

Как обстоит дело в случае с этими измученными исследователями ирисками? Они весьма неплохо разделяются линейными границами — многомерными плоскостями, ну т.е. это шикарная задача, в которой решение имеется… грубо говоря, 80% ирисок из каждого класса достаточно компактны и не пересекаются с другими классами. Дальше вопрос — как найти эту границу? Можно написать уравнение разделяющей плоскости аля LDA и потом решить систему уравнений — получите результат. Можно сделать случайный поиск коэффициентов разделяющей плоскости — опять получится результат. Можно науськать обычный перцепртрон… он сделает то же самое… Потому что решение имеется. Иными словами, конкретные методы машинного обучения в данном случае являются не методом решения исходной задачи, а лишь средством её решения.

Что в случае с ценовыми последовательностями? Кому удавалось видеть, чтобы общий набор почти случайных баров за счет какого-то преобразования давал условное и безусловное распределения, в которых мы бы видели, чтобы разделялись плохие и хорошие или покупки и продажи хотя бы в пропорции 60 на 40%? Кстати, в HFT обычно граали начинаются от пропорции 45 на 55 — этого достаточно уже.

Поэтому, когда вы примените к некоторой смеси объектов (построенных на цене) машинное обучение, то при должной сложности средств этого обучения, вы легко найдете разделяющие границы в рамках этой смеси. Но будет ли смысл в этом разделении? Эта беда именуется переобучением, а по факту к обучению она отношения не имеет… ибо чему тут учится система? Ну она просто запоминает индивидуально ситуации, т.е. локализует каждый объект в пространстве поиска.

А как отличить на этой стадии переобучение от не-переобучения? Реальный критерий один — если по этому удается зарабатывать на реальном счете.

Иными словами, собираясь применять средства машинного обучения, вы должны уже заранее знать, какое решение вы ищите и чему обучаете свою систему. Т.е. опять же сперва вы должны поставить осмысленную задачу, в которой логически есть решение.

Применение машинного обучения снизу-вверх — удел совсем романтичных романтиков:)

16 апреля 2016, 04:44
Ответить

Sergey Pavlov, +, а еще классические алгоритмы хорошо приспособлены для поиска оптимальной модели по всем данным сразу т.е. каждая точка данных весит примерно одинаково. Это годится для торговых моделей которые все время в рынке. А значит в основном торгует шум. Торговые алгоритмы которые выжидают момента, а потом входят не на долго в рынок, требуют чтобы мы сильно по разному относились в областям где позиция открыта и где нет. Т.е. алгоритм учить надо с учетом этого, а в классике это сложно, включая нейросети.

16 апреля 2016, 12:36
Ответить

ivanovr, на мой скромный взгляд, обучаемые системы в трейдинге полезны для одного — поиска закономерности в исходных данных. Логически такая постановка обоснована, поскольку человеческий глаз многое не увидит сразу, а многое вообще не сможет увидеть. Плюс к этому машина проведет намного больше экспериментов нежели человек. Но потом все равно перед человеком встанет вопрос о принятии или отклонении гипотезы о том, можно ли считать найденное нечто закономерностью.

16 апреля 2016, 12:49
Ответить

Sergey Pavlov, это да, но я про то, что классические алгоритмы ищут не совсем то. Не рост эквити а какой-то там свой показатель качества да еще в предположении что все данные одинаково важны. Потому куда правильнее искать алгоритм, а качество оценивать по эквити. Тут лучше всего подходит какая ни будь эволюционная оптимизация.

16 апреля 2016, 12:57
Ответить

ivanovr, подозреваю, что всё это — игра слов. Любое из средств машинного обучения вполне можно назвать эволюционной оптимизацией:) Вообще было бы интересно посмотреть… необязательно применительно к ценовым последовательностям… в любой области… где машинное обучение из исходного хаоса само чему-нибудь таки взяло да научилось:) Может у кого есть информация о таких примерах?

17 апреля 2016, 04:37
Ответить

Sergey Pavlov, можно назвать оптимизацией, но не эволюционной (так называется вполне определенный класс алгоритмов). Но важно какую функцию оптимизируем. В случае большинства алгоритмов максимизируется некий показатель качества, который напрямую с качеством эквити не связан.
Про хаос вопрос не понял. Что там за хаос. Всегда решение ищется на ограниченном объеме входных данный и форма решения тоже ограничивается. Если пространство решений будет бесконечно, то вероятность получить переобучение стремится к 1.

17 апреля 2016, 21:03
Ответить

ivanovr, либо минимизируется функция потерь, например, сумма квадратов ошибок. Либо максимизируется информация или разница в энтропии.

18 апреля 2016, 13:35
Ответить

Sergey Pavlov, возможно, вот такой пример имеется в виду? http://smart-lab.ru/blog/307172.php

17 апреля 2016, 21:06
Ответить

ivanovr, интересный пример, спасибо!

18 апреля 2016, 04:24
Ответить

Sergey Pavlov, сверточные сети и фильтры габора например

Mr_X

18 апреля 2016, 17:30
Ответить

Mr_X, названий много, а есть ли успешные внедрения?

18 апреля 2016, 19:01
Ответить

Sergey Pavlov, да, поиск по картинке

Mr_X

18 апреля 2016, 19:45
Ответить

Sergey Pavlov, именно для этого я и начал все это изучать. Когда я смотрю глазами и торгую руками, я склонен переоценивать какой-то один фактор или вообще вступать в ступор. Например, пусть тренд по нефти на часовике вверх, а последний отчет по запасам при этом показал, что запасы выросли. Вот что делать? Надеюсь, машинное обучение поможет принимать решения в таких ситуациях.

18 апреля 2016, 13:26
Ответить

SciFi, если у вас это получится, это будет очень здорово:) не забудьте похвастаться потом!

18 апреля 2016, 15:44
Ответить

Что скажете? Есть ли там грааль? Есть ли у кого-то опыт использования машинного обучения для торговли? Что посоветуете?

Грааля нету.
А мораль проста -
Нельзя просто так взять и обучить машину делать то, чего сам делать не умеешь.

SMT

16 апреля 2016, 04:54
Ответить

машинное обучение полностью зависит от того, какие данные ты ему будешь скармливать. если ты найдешь такую альфу — то да, возможно это и есть твой грааль. но обучение — это метод, не более того. ну и оверфиттинг, конечно, возможен, особенно, если входных классификаторов очень много

day0markets.ru

16 апреля 2016, 08:57
Ответить

Alex Hurko, Алекс не криви душой) это же полный бред, сам то ты не работаешь с упакованными данными.

спидараминепью

16 апреля 2016, 11:13
Ответить

Попробовал R и сделал вывод что для выборок большого объема он не приспособлен. А это, пожалуй, противоречит задаче.
Python для этой цели интереснее.
Но на деле использую нормально компилируемый язык ;)

16 апреля 2016, 12:28
Ответить

Это не обучение, это запоминание. Запомнит цены и будет выдавать прогнозы, когда они будут совпадать. Если у вас есть опровержение — готов выслушать.

Чарльз Маккей

16 апреля 2016, 23:44
Ответить

MyKey, не запоминание, а поиск скрытых закономерностей. Для меня главное, чтобы обучение позволило распознавать с повышенной вероятностью хорошие точки входа. При использовании какого-нибудь TSLab, который позволяет проверять алгоритмы на истории, мы задаем зависимости (например, гипотезу о том, что скользящие средние влияют на цену в будущем) и проверяем их статистически. При использовании же машинного обучения мы пытаемся найти эти зависимости. В этом отношении машинное обучение, на мой взгляд, круче. Правда, логически объяснить, почему Газпром именно так влияет на Сбербанк будет сложно. Но если влияет, почему бы это не торговать? )