Избранное трейдера MimoInvestor
Привет, в этот раз будет общий пост про полезные источники в сети, где можно бесплатно взять данные, примеры кода и другие полезные вещи.
Более направленные подборки по идеям можно посмотреть здесь https://smart-lab.ru/blog/628709.php, а по книгам здесь https://smart-lab.ru/blog/681121.php
Биржевые данные:
Биржевые:
Можно найти много подборок фильмов о бирже, но какие из них полезны для получения знаний? В CFA Institute опубликовали исследование, в котором 334 преподавателя финансов по 4-бальной шкале оценивают пользу самых известных кинопроизведений.
1. Игра на понижение/The Big Short (2015)
Оценка: 3,59
Экранизация книги Майкла Льюиса о крахе ипотечного рынка в США в 2007 году. В центре внимания управляющий хедж-фондом Майкл Бьюрри (Кристиан Бэйл), поставивший на падение стоимости ипотечных облигаций. В фильме есть не только увлекательный сюжет, но и Нобелевский лауреат Ричард Талер, рассказывающий о принципе работы рынка субстандартных ценных бумаг.
2. Ставка на триллион/Trillion Dollar Bet (2000)
Всем привет!
Вчерашний пост вызвал у некоторых пользователей данного сообщества бурную реакцию, видимо потеря денег на рынке сказывается на психике, сложно принять чужой успех))) Ну и ладно… желаю им по скорей восстановить свои депозиты)
Сегодня хотелось бы обсудить перспективы следующих 10 лет, то есть, какие глобальные тренды нас ждут впереди, и как на этом заработать?
На мой взгляд, нужно отталкиваться от перспектив инфляции/дефляции и замедления/роста экономики в мире
Не раз здесь уже выкладывали данную картинку
Предположу, что нас ожидает переход от дефляционного спада к стагфляционному спаду
Текущий дефляционный спад ярко выражается через рост золота и долгосрочных облигаций США (TLT), следовательно в случае стагфляционного спада следом подтянется остальное сырье (энергоносители, промышленные металлы, сельхоз продукция)
Начал вчера работы по реализации "Брошенной стратегии". Хорошо когда есть наработки: взял готовые куски кода, немного доработал под новые нужды, соединил их вместе и уже все готово — почти все необходимые данные передаются в DLL, расставляются по местам и готовы к использованию. С этим почти закончено, остальное будет делаться по ходу пьесы, и по мере необходимости.
С передачей данных закончено, а стратегия даже не начиналась. Система новая и архитектора системы пока не ясна, есть несколько вариантов, выбрать из которых не так просто.
Пока суд, да дело, решил написать о передаче данных из Quik в С++DLL.
О том как сделать простую С++DLL для работы с Quik-Lua написано на сайте https://quikluacsharp.ru здесь и о передаче данных из Lua — здесь и в других материалах сайта. Наверняка многие из вас все это видели и знают, а некоторые это даже применяют. Я это все не использую, не очень разбирался, но, тем не менее, сам сайт
Так как насчет практического применения ML? Как вообще это выглядит?!
А выглядит это так, что 80% времени data scientist тратит на работу с данными, чтобы потом загнав их в модельку мобильно получить прогноз. Вообще, предполагалось что такой мощный инструмент как нейросети сможет работать с сырыми данными, то есть загонишь в нейросеть обычную котировку, а дальше могучие нейроны похимичат, сгенерируют кучу фичей и найдут нужную их комбинацию (на самом деле никаких фичей нейросети на создают, но можно представить). Ну вот например такое явление как большой ГЭП, важный показатель? Еще какой! В сырых данных он содержится, то есть можно помечтать что если мы создадим очень сложную нейросеть, то она сможет вытащить это значение самостоятельно. Что такое ГЭП нейросеть конечно не знает, но путем манипуляций с весами она найдет, что когда меняется циферка в дате то образовавшийся большой разрыв в цене имеет большое влияние для хорошей аппроксимации.
Мечты, мечты. Пока все что я видел в результате скармливания нейросети сырах данных-это слезы, боль и убожество. В общем мы пойдет другим путем. Мы не будет скармливать модели сырятину и мусор, мы постараемся кормить его качественно чтобы удои увеличивались и все такое.
Есть такое понятие как в ML как feature engenering. Наверно единственное более менее креативное что остается человеку в этом бездушном мире машинного обучения. А уж коли мы ведем речь о RF, то сам бог велел заняться этим, RF знаете ли не нейросети, там даже теоретически сырятина в данных не приветствуется. Вот этим мы и займемся.
Откуда же нам взять эти фичи и главное как? Тут каждому воля вольная. Например можно сдув пыль с WealthLab использовать старичка как генератора фичей. Кто не знает в него вшито около полусотни известных индексов и еще столько же, но с неизвестным кодом. А еще можно запрограммировать свои фичи. По своему «знанию и разумению», своих «знаний и разумений» я накопил много, но почти все они из разряда «все эти технические индикаторы не стоят ничего». Зато кое что из своего показали свою небезнадежность. В общем на первый случай я сгенерировал около 17 своих фичей, затем ранжировал их для каждой стоки, итого 34 фичи. Стоки брал из числа 20 самых ликвидных отечественных фишек с 2010 года по март 2018, что дало 50 тысяч дневных наблюдений. Прямо сказать не густо, но что есть. Тем более речь идет о демонстрации силушки RF.
Вот набор моих фичей:
Week 49303 non-null int64 GEP 49303 non-null float64 Min10 49303 non-null float64 Cl/High 49303 non-null float64 Cl/Low 49303 non-null float64 Cl/w_High 49303 non-null float64 Cl/w_Low 49303 non-null float64 wdif 49303 non-null float64 dif 49303 non-null float64 Vol20/Vol200 49303 non-null float64 tHigh% 49303 non-null float64 tLow% 49303 non-null float64 tHigh%-tLow% 49303 non-null float64 Cl/SMA21 49303 non-null float64 Cl/SMA5 49303 non-null float64 SMA5-SMA21 49303 non-null float64 Cl/(minSMA) 49303 non-null float64 Cl/(maxSMA) 49303 non-null float64 l_Min10 49303 non-null int64 s_Min10 49303 non-null int64 l_gep 49303 non-null int64 s_gep 49303 non-null int64 l_cl/high 49303 non-null int64 s_cl/high 49303 non-null int64 l_cl/low 49303 non-null int64 s_cl/low 49303 non-null int64 l_wdif 49303 non-null int64 s_wdif 49303 non-null int64 l_SMA5-SMA21 49303 non-null int64 S_SMA5-SMA21 49303 non-null int64 L_Cl/(maxSMA) 49303 non-null int64 S_Cl/(maxSMA) 49303 non-null int64 L-tHigh%-tLow% 49303 non-null int64 S_tHigh%-tLow% 49303 non-null int64
При отборе российских акций в свой портфель одним из критериев, который я использую является «Биссектриса Арсагеры», довольно интересная методика. Сейчас решил применить данный способ и на американских акциях, которые я покупаю на СПБ. Составлю модельный портфель.
Чтобы понять, что такое Биссектриса Арсагеры, рекомендую к прочтению статью Биссектриса Арсагеры, или что должна делать каждая компания.
В новом издании книги Заметки инвестирования есть глава про биссектрису.
И арсагеровцы пошли дальше – добавили третье измерение (изменение цены P), и биссектриса Арсагеры стала объемной (стр. 490). Очень интересно. Не пожалеете если изучите данную тему, очень полезно в отборе перспективных акций.