dip
dip личный блог
08 октября 2018, 19:41

Как вы качаете исторические данные с yahoo.finance ?

Ну собственно сабж. Созрел обработать множество тикеров. Кто как качает? Что за программулины используете? Как автоматизируете ? 
Спасибо! 
31 Комментарий
  • Тарас Громницкий
    08 октября 2018, 19:55

    Качаем данные из TWS(Interactive brokers).

    Своим софтом.

      • Тарас Громницкий
        08 октября 2018, 20:17

        dip, всю, которая есть по инструменту.

        Главное соблюдать таймауты между запросами и параметры самих запросов.

        Этим занимается программа.

        Заряжаем тикеры, задаём фрейм, период и идём курить.

          • Тарас Громницкий
            08 октября 2018, 20:22

            dip, это вопрос.

            С ходу даже не скажу.

          • Тарас Громницкий
            08 октября 2018, 20:40

            dip, помнится в документации нашёл не всё.

            Поэтому общался с поддержкой.

            Не более 2000 баров за 1 запрос.

            Таймаут не менее 2х секунд между запросами.

            Не более 60 запросов за 10 минут(немного можно превышать).

            Вы собираетесь писать самостоятельно ?

            Могу адаптировать наш модуль и дать на пробу.

            Интерфейс там простой и понятный.

            Вопрос лишь в каком формате скидывать данные в файл.

  • Vladimir Diaditchev
    08 октября 2018, 19:59
    Скрипты на языке R это могут.   Тут об этом:
    stackoverflow.com/questions/48568159/get-data-from-yahoo-finance-to-r
    и вот тоже об этом:
    blog.revolutionanalytics.com/2015/08/plotting-time-series-in-r.html

  • Anton Shabunin
    08 октября 2018, 20:58
    Качество данных на яхе после мая прошлого года ужасное. Любые другие API типа Tiingo или Barchart гораздо лучше.
  • Алексей Макаренко
    08 октября 2018, 21:35
    Я использовал дату из yahoo через xlq. Удобно линковать с excel. Купил одну лицензию, поставил на три машины. Через IB выкачивал тоже данные в R, но сталкивался с рядом ограничений. Сейчас всю выкачку делаю через платный bloomberg terminal, но и там столкнулся с ограничениями, и даже умудрился за месяц перелимитить количество запросов по бумагам.
    • Тарас Громницкий
      08 октября 2018, 21:56
      Алексей Макаренко, с какими ограничениями в IB столкнулись?
      • Алексей Макаренко
        08 октября 2018, 22:05
        Тарас Громницкий, Я столкнулся с ограничениями информационного характера. Ряд запросов по облигациям не смог удовлетворить через их апи.
        • Тарас Громницкий
          08 октября 2018, 22:08
          Алексей Макаренко, т.е. истории по некоторым бумагам у IB нет?
  • Алексей Макаренко
    08 октября 2018, 22:14
    Я не смог вытащить купоны по ряду облигаций. Историческую дату по акциям тащило хорошо, но шаг влево — шаг вправо, и уже всё не так радужно. Была проблема с дивами и сплитами по акциям. Вероятно, это моя проблема, и вероятно, именно я не до конца разобрался, но их апи часто просто подвисало во время торгов, и после очередного раза встал вопрос надежности поставщика котировок. 
    • Тарас Громницкий
      08 октября 2018, 22:19

      Алексей Макаренко, вероятнее всего не соблюдали какие-то ограничения API.

      Я облигации не тащил, но акции и фьючи выкачивал нормально.

      Вплоть до минуток.

      Разумеется, при меньших фреймах время загрузки увеличивается.

      • Алексей Макаренко
        08 октября 2018, 22:24
        Тарас Громницкий, Да, это так. Я с их саппортом сидел на телефоне регулярно, чтоб найти причины зависаний, но как считаю, основная причина была в большом количестве запросов. То есть, в теории, мне говорили, что проблем возникать не должно, а по факту было иначе. 
        • Тарас Громницкий
          08 октября 2018, 22:25

          Алексей Макаренко, как писал выше есть ограничения по количеству баров за запрос, таймауту между запросами и пр.

          Если их соблюдать, то всё нормально работает.
          • Алексей Макаренко
            08 октября 2018, 22:31
            Тарас Громницкий, сколько тикеров в минуту максимально Вам удавалось вытащить без проблем (если, конечно же, такая задача стояла)? Так же интересно, какие конкретно запросы были, помимо запроса исторической цены?
            • Тарас Громницкий
              08 октября 2018, 22:38

              Алексей Макаренко, в единицу времени даже не скажу.

              Грузил в один поток пару сотен тикеров за 5-7 лет.

              По времени занимает(не соврать бы) около 20-30 минут.

              Получал именно бары OHLCvolume.

              Когда основные данные получены к ним добавляются актуальная информация раз в день или несколько дней.

              Тут конечно всё быстрее.

              Вам сколько тикеов, какого фрейма и за какой период необходимо получить ?

              • Алексей Макаренко
                08 октября 2018, 22:52
                Тарас Громницкий, Касаемо акций, мне нужны были данные по дивам, по daily close, description'y. Инструментов — от 800 до 2000 тикеров, в зависимости от активности торгового портфеля. 
                • Тарас Громницкий
                  08 октября 2018, 22:55

                  Алексей Макаренко, какая глубина истории ?

                  Нужны именно дневки или мельче ?

                  Про дивы пока ничего сказать не могу.

                  Но практически уверен, что со всеми бустами история в IB будет дешевле, чем в Bloomberg.

                  • Алексей Макаренко
                    09 октября 2018, 08:50
                    Тарас Громницкий, Это — то, что требовалось ранее. Сейчас всё стало иначе, без блума уже тяжело
                    • Тарас Громницкий
                      09 октября 2018, 09:45

                      Алексей Макаренко, если всё стабильно, то хорошо.

                      Однако, на досуге прикиньте выгоду и удобство.

                      Если увидите плюсы в работе с IB, то обращайтесь.

                      Практически весь API IB освоен и обкатан на практике.

                      От работы с данными до создания полностью автономных торговых систем.

Активные форумы
Что сейчас обсуждают

Старый дизайн
Старый
дизайн