Озадачился поиском и сбором датасета со всеми возможными данными о дивидендах. И помог мне в этом, кто бы мог подумать, сам СМАРТЛАБ!
Собрал это в один csv:
1. Удалены строки с отсутствующими значениями, все это 10 эшелон
2. Див. доходность пересчитана до 2 знаков после запятой
3. Данные приведены в стандартный вид для анализа
4. Удалены строки с аномальными значениями
Пригодится для собственных исследований, составления стратегий по гэпам (https://smart-lab.ru/blog/1015561.php), либо как дополнительная информация для ваших уже имеющихся стратегий (например, отключение сделок в дни гэпов)
UPD: если ваша программа не читает, установите кодировку encoding='cp1251'. В pandas это обязательно!
СПАСИБО, СМАРТЛАБ!
VK представляет новое решение для обучения искусственного интеллекта (ИИ) — вертикальное федеративное обучение (VML). Это позволяет тренировать модели на данных из разных баз, минимизируя риск утечки персональных данных. Руководитель группы Data Science VK, Артем Агафонов, объясняет, что данная технология позволяет обучать модели без фактического обмена данными между компаниями.
Сейчас для обучения аналитических моделей компании вынуждены делиться своими данными, что не всегда безопасно. VK предлагает альтернативу, где модели могут обучаться на разных данных, но без фактической передачи информации. Это позволяет предсказывать спрос и предложение, прогнозировать поломки оборудования и многое другое.
Технология уже тестируется с несколькими партнерами из ритейла и девелопмента, и VK планирует в дальнейшем продавать это решение. Однако эксперты указывают на необходимость решения двух ключевых проблем: поиск партнеров с нужными данными и качественная разметка данных для обучения моделей.