Постов с тегом "Data Mining": 27

Data Mining


Как cтартануть в алготрейдинге (без воды)

    • 07 июня 2025, 22:54
    • |
    • Cobra
  • Еще

Давненько я не брал в руки шашек, не писала на Смарт Лаб.
Всем доброго вечера.

Четкая схема разработки торговой системы

1. Формулирование гипотезы или поиск идеи.

анализируем рыночные аномалии, поведенческие паттерны, экономические теории, технические индикаторы (комбинации, дивергенции), статистические свойства (среднее реверсия, тренды, волатильность), макроэкономические данные, «подсмотренные» идеи (с последующей глубокой переработкой).

2. Сбор и предобработка данных. (очень важно!)

Уделите внимание качеству и актуальности данных, которые вы собираете.

3. Data Mining.ищем неочевидные, статистически значимые паттерны в исторических данных (цена, объем, ордербук, альтернативные данные).

4. Разработка и кодирование стратегии.алгоритмизируем правила входа/выхода, позиционирования (размер позиции).Языки: Python или Lua из визуальных платформ, TSLab например

5. Бэктестинг.Разные периоды. Обязательно должно быть строгое историческое тестирование на Out-of-Sample (OOS) данных. Т.е разрабатываете на одном периоде, стресс тест на другом (это тоже важно)

( Читать дальше )

Перспективы акций ИТ-компаний России в 2025 году: пример Группы Аренадата (DATA)

$DATA ищите прошлые прогнозы актива? сюда тык 👉 #прогноз_smart_investor_data
📈 Прогноз цены Обзор и технический анализ 📉 компании 💼 Группы Аренадата (DATA) #АкцииРФ #РоссийскийФондовыйРынок #ИнвестицииВРоссии #ФинансовыйАнализ
❗️❓НАПИШИТЕ В КОММЕНТАРИЙ КАКОЙ АКТИВ РАЗОБРАТЬ ЗАВТРА❓❗️

🔸графика мало, поэтому прогнозировать сложно, НО
🔸у цены восходящий тренд и локально можно рассчитывать на рост
🔸если до середины января 2025 цена закроется ниже 126 руб., то сформируется паттерн на коррекцию и можно будет цену ловить на 117 руб.

подробнее в статье тут 👉Перспективы акций ИТ-компаний России в 2025 году: пример Группы Аренадата (DATA)

Перспективы акций ИТ-компаний России в 2025 году: пример Группы Аренадата (DATA)


💛1. Макроэкономические факторы💛
Состояние экономики РФ:
Если экономика продолжит стабилизироваться или расти, спрос на ИТ-услуги и инновационные решения будет увеличиваться, что положительно скажется на акциях таких компаний.
💸Инвестиции в ИТ-сектор:💸
Государственные программы поддержки цифровизации и импортозамещения могут стать драйвером роста для компаний, работающих в области хранения данных и ИТ-решений.



( Читать дальше )

Данные говорят. Корреляция графиков зависимости лонга и шорта от значения параметра.

Всем привет. С вами рубрика «Данные говорят». Да, это первый выпуск в этой рубрике). В этой рубрике мы будем разговаривать с данными. Нет, я не сошел с ума. Данные будут говорить, а я только слушать. А с вами данные тоже разговаривают?


Погнали. Под данными в данном случае имею в виду числа, графики числовых рядов, таблички и аналогичное. В данном конкретном случае речь про числа, графики, таблички по итогам бэктестов стратегии (её болванки, или другими словами корневой идеи).


Если уметь слушать данные, то можно многое услышать – например, например, можно находить баги в коде стратегии, интересные идеи, резервы и т.д. Затягиваешь параметром диапазон значений, а число трейдов растёт? – Ну значит где-то баг. Если вслушиваться в данные – иногда можно идентифицировать не только факт наличие бага, но и его локализацию и характер.

 

 

Теперь конкретней про «корреляция графиков зависимости лонга и шорта от значения параметра». Наверно, по формулировке не очень понятно, о чем речь. Тем более, предположу, что так глубоко и в эту сторону копают не только лишь все. Поэтому поясню: допустим, я хочу понять роль параметра А в стратегии, самый простой вариант – не шевеля параметры Б, В, Г и Д, перебирать А с некоторым шагом. Вот мы пошевелили А, не шевеля Б, В, Г, Д. А теперь для каждого прогона посчитали, допустим Profit Factor (возьмем его условно за некий показатель, характеризующий качество стратегии) отдельно для лонговых позиций и отдельно для шортовых. Ну и построили два графика – значение PF в зависимости от А для лонга и значение PF в зависимости от А для шорта. Так вот, иногда/часто эти графики будут прилично коррелировать.



( Читать дальше )

Парсинг постов Смартлаба. Темы декабря 2018

Предлагаю вашему вниманию новый пост о применении data mining к текстам, спарсенным из блогов Смартлаба.

Идея исследования: ежемесячно парсить все посты со Смартлаба и применять к ним метод из класса методов тематического моделирования.

В прошлый раз был применён метод BigARTM из класса методов тематического моделирования. Ряд темы оказались не вполне интерпретируемы. Кроме того этот метод — несмотря на всю его прогрессивность (детальное описание: Воронцов К.В. Вероятностное тематическое моделирование: обзор моделей и аддитивная регуляризация) по сравнению со, скажем, методом LDA - не лишён существенных недостатков. Так, он не позволяет юзеру автоматически выбирать число тем, а также не предлагает метрики для выяснения, какую долю исходной информации позволяет сохранить модель в целом и отдельные темы — в частности

Поэтому моя команда разработала собственный оригинальный метод тематического моделирования. Он позволяет группировать слова («термы», «токены») из множества документов по темам. При этом — в отличие от большинства аналогов — он позволяет автоматически выбирать число тем, а также включает простые и понятные метрики, которые позволяют выяснить, какую долю исходной информации позволяет сохранить модель в целом и отдельные темы — в частности.



( Читать дальше )

Google Colab: Российский рынок - по многочисленным просьбам

В одном из предыдущих постов писал про Google Colab — бесплатный доступ к интерактивной среде Jupyter Notebook на языке Python с кучей библиотек для анализа данных (и самой популярной — Pandasобучалки-введение).
   Низкий порог входа в мир серьёзного анализа данных -тем и привлекателен этот зоопарк. Несколько строк кода и уже можно анализировать-смотреть данные (акции, облигации, фьючи, макро).

   Если вы пробовали писать скрипты в Excel, кастомные индикаторы в Мультичартсах или Метастоках, то освоить язык Python в интерактивной среде Jupyter Notebook (Google Colab — даёт бесплатный доступ) — посильное занятие.
   Для американского рынка есть библиотека (-ки), которые позволяют подкачать биржевые и экономические данные — я писал об этом. Кстати к 

( Читать дальше )

Парсинг постов Смартлаба. Темы октября 2018

Предлагаю вашему вниманию пробный пост о применении data mining к текстам, спарсенным из блогов Смартлаба.

Идея исследования: ежемесячно парсить все посты со Смартлаба и применять к ним метод BigARTM из класса методов тематического моделирования.

Методы тематического моделирования (детальное описание: Воронцов К.В. Вероятностное тематическое моделирование: обзор моделей и аддитивная регуляризация) позволяют группировать слова («термы», «токены») из множества документов по темам.

Интерпретация тем – дело исследователя. К сожалению, не всегда удаётся проинтерпретировать набор слов, т.е. по этому набору назвать тему. Я буду приводить как наборы слов по темам, так и мою интерпретацию тем. Вы же при желании сможете дать свою интерпретацию.

В дальнейшем – при накоплении статистики – можно искать связи между событиями и их отражением или не отражением в виде постов на Смартлабе.

В октябре 2018 на смартлабе было опубликовано свыше 4000 постов.



( Читать дальше )

Где легче майнить идеи?

Кто-нибудь обращал внимание на подобную закономерность? — В смысле она вообще есть? — Далее о самой возможной закономерности.

Есть такое понятие ниша. Эта штука работает везде — в бизнесе, в трейдинге, где угодно — универсальное понятие. После появления крипты, наприме, через какое-то время сформировалась ниша или группа ниш — там лежало бабло — много бабла, мало конкуренции, как результат низкие усилия на то чтобы взять бабло. Это основной принцип ниш — именно такая связь между объемом лежащего бабла, конкуренцией и легкостью получения бабла в пределах ниши.

В трейдинге ниши есть, например, при майнинге идей. В финансовых рынках миллион разных закоулков, нюансов, деталей, способов анализа, методов и подходов, миллион инструментов и т.д. И я почти уверен, что здесь эта тема с нишами так же работает. И вот интересно, кто-то на себе это замечал? — что если вдруг выходишь на нехоженую тропу, то возможности, неэффективности гроздьями вдоль дороги валяются и все сплошь рабочие. Есть такое? — Или закономерности и неэффективности размазаны ровным слоем? — Или все-таки стоит поощрять себя активно включать креативное мышление и пытаться найти те самые нехоженые тропы, нежели выдаивать что-то что уже давно лишено жизненных соков?


В явном виде я такую связь не замечал, но умозрительно мне кажется, что она должна быть.


....все тэги
UPDONW
Новый дизайн