Гуру Хренов
Гуру Хренов личный блог
30 мая 2017, 01:06

вам, роботостроители (извините что не про биткойн)

на Kaggle недавно завершилось соревнование под названием «two sigma financial modeling»
www.kaggle.com/c/two-sigma-financial-modeling/kernels
Задача представляла из себя классическую проблему предсказания цены актива 
Какой то нью йоркский хэдж-фанд слил кучу features, причем обезличенных, и даже не говоря при этом, с каким шагом по времени (хотя участники соревнования вроде быстро раскусили и название features, и шаг по времени), и надо было предсказать следующую цену актива
Предсказания в Kaggle обычно делаются посредством искусственного интеллекта (сейчас это обычно supervised классификаторы на основе XGboost, плюс (всё больше и больше) нейронные сети, плюс иногда unsupervised learning, плюс bagging и обычно на закуску stacking разных моделей)
По правилам соревнования, код победителей принадлежит его организаторам, поэтому, увы, там почерпнуть ничего не удасться (выигравшие Kernels публиковаться не будут)
Но участники в соревнованиях на Kaggle — реально круты, и некоторые из них в процессе соревнования делятся идеями (в разделе «Discussion») и кодом (в разделе «Kernels»)
Я в этом соревновании не участвовал, так как вляпался в другое соревнование от той же конторы, и эпично там тупил 2 месяца (хотя и научился очень многим приемам и перешел из разряда полного баклана в начинающего чайника)
Собственно, по этой причине я и заморозил на время свой проект с машинным обучением — потому что пришел на Kaggle, и понял, как мало я знаю :-)
Я абсолютно уверен, что, покопавшись в вышеупомянутых кучах навоза соревнования от two sigma, можно найти много жемчужных зерен для построения своих роботов
Ни у кого нет желания ко мне присоединиться и покопаться в этом продукте, и потом поделиться мнениями?
9 Комментариев
  • Я не пью!
    30 мая 2017, 01:10
    Давай. Я участвовал в похожем соревновении на кагле полтора года назад, но даже не помню название фонда уже, можно посмотреть. Здесь features были только ценовые или макро- + ебитда?
  • EZ
    30 мая 2017, 09:56
    Это интересно, надо будет покопаться.
    Я как-то раз попробовал в соревновании поучаствовать ради опыта, но быстро бросил, а так, в плане обучения это очень круто — многое узнаёшь. 
  • SergeyJu
    30 мая 2017, 11:07
    Посмотрел на Ваш первый пост про машинное обучение. С удивлением обнаружил там дискуссию с участием себя-любимого, Павлова и Гурко. И все трое, очевидно практики, из всего машинного леннинга выделяют наивного байеса. 
    Но готовят его по разному. 
    И еще интересная вещь, тему низкого отношения сигнала к помехе в ценовых данных вообще никто со мной обсуждать не хочет. Имхо, именно в этом отношении причина, почему стандартный многопараметрический леннинг не удается хорошо приспособить к реальной торговле.
  • scooter
    30 мая 2017, 14:44
    Интересно было бы поучаствовать, но я даже не полный баклан ещё пока
  • nbvehrfr
    31 мая 2017, 01:50
    Не теряйте времени, все топ участники на кэгл галимые подгонщики.
    интервьюировали мы одного из топ3 — чел абсолютный профан в понимании что есть статистическое обучение и как работать с фичами

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн