Блог им. kulakov74

Сообщения о выплатах на e-disclosure - ключевая информация

Я иногда смотрю сообщения про купоны на e-disclosure и там такие тексты, что очень сложно разобраться и понять, о чём речь, сколько выплатили и как. И я решил написать скриптик для выделения ключевой инфы из таких сообщений, чтобы не искать её в тексте. В результате получаются разные варианты. Это просто купон:
Сообщения о выплатах на e-disclosure - ключевая информация
Это купон и амортизация: 
Сообщения о выплатах на e-disclosure - ключевая информация
Может быть одно сообщение как здесь, а может быть 2 отдельных, одно про купон, одно про аморт. Это купон и погашение:

Сообщения о выплатах на e-disclosure - ключевая информация
Вот купон в долларах:
Сообщения о выплатах на e-disclosure - ключевая информация

Ещё бывает в юанях и евро, юани я делал, в смысле символ валюты показываю как тут доллар, а евро нет т.к. он редко бывает. Заодно дивы попались:
Сообщения о выплатах на e-disclosure - ключевая информация
Также, если объём выплаты не 100% (при техдефолте), этот момент выделяется красным и в таком случае пишется и объём выплаты:
Сообщения о выплатах на e-disclosure - ключевая информация

Заодно сделал выделение текста сообщений в каждом параграфе, чтобы легче было понять, где начинается собственно текст и где заканчивается заголовок параграфа. Это работает не только для сообщений про выплаты, а для всех вообще:

Сообщения о выплатах на e-disclosure - ключевая информация

Принцип работы скрипта такой: находим нужный абзац и в нём удаляем всё лишнее. Т.е. я просто показываю все числа, что есть, при этом удаляя ненужное, типа «п. 5.4» или «12345 штук облигаций». Работает это в Хроме через расширение «User JavaScript and CSS» как обычно. Код можно взять здесь

Думал, сделаю за 1 вечер, в результате провозился недели 2 (вечерами). Всё дело в том, что, как оказалось, что никакого стандарта таких сообщений нет — каждый эмитент может писать в своём формате. При этом, ошибки могут быть в чём угодно, чего я только не видел. Даже русские буквы в Isin (RU000A108РС1) или Isin с пробелом «RU000A10 CSD0». 

В результате пришлось очень долго тестировать и просматривать много сообщений. Вроде всё работает, потом раз — оказывается, что есть ещё и другой формат, надо понимать и его. Меняешь скрипт и всё по новой. Если попадётся какой-то невиданный вариант, то скрипт и сейчас может выдать что-то не то. 

Не понимаю, почему Интерфакс не сделал для всех эмитентов единую форму, чтобы нужно было только ввести числа и не придумывать каждый раз текст заново.

Данная публикация является личным мнением автора. Мнение владельца сайта может не совпадать с мнением автора.
440

Читайте на SMART-LAB:
Фото
Фонд «Акцент 5» увеличил вес в Индексе МосБиржи фондов недвижимости
Вес паев ЗПИФ недвижимости «Акцент 5» в базе расчета Индекса МосБиржи фондов недвижимости (MREF) увеличен с 12,3% до 15% по итогам...
Фото
"Селигдар" выпустил первый гибридный золотой ЦФА
«Селигдар» — первый российский золотодобытчик, который выпустил гибридные ЦФА. Они предоставляют инвестору право на получение слитков...
Фото
Трейдеры не спешат восстанавливать длинные позиции даже после отскока индекса Мосбиржи
Фото
Транснефть: возвращение блудного сына или опять по 1200
Транснефть вновь упала на интересные уровни ~1200 руб По этим ценам в октябре 2025 года я ставил 4-ку и удалось хорошо заработать...

теги блога СергейК

....все тэги



UPDONW
Новый дизайн