Дополнение к серии «Портфельная оптимизация как бустинг на слабых моделях»
Результаты оценки любых случайных величин представляют из себя случайную величину. Не исключением здесь будут оценки ковариации.
Особенно сильно эффект неточности полученных оценок (случайности статистик) будет проявляться в портфелях, составленных из большого количества ценных бумаг — большего или сопоставимого количеству располагаемых наблюдений. И, поскольку, в некотором приближении задача портфельного инвестирования сводится к поиску двух максимально независимых активов из множества:
где R — коэффициент взаимной корреляции — её решение, естественным образом, будет располагаться в области максимально отрицательной статистической ошибки.
Иными словами, вследствие нелинейности самой задачи, ошибки в определении статистической взаимосвязи различных активов не уничтожаются суммированием( как это происходит при подсчёте средних), а, наоборот, усиливаются функцией min / max и приводят к абсолютно непредсказуемым, хаотичным результатам. Что, в свою очередь, означает не только не-оптимальные инвестиционные решения, но и большой объём «паразитного» оборота, повторяющего случайные блуждания портфеля, требующего повышенной ликвидности и разоряющего инвестора комиссиями биржи.
- Усадка ковариационной матрицы (Shrinkage)
Для решения этих нелинейных проблем возможно использовать простые линейные алгоритмы, позаимствованные из методов статистической регрессии и известные как регуляризация (Тихонова, Лассо и пр.). Смысл этих методов состоит в том, чтобы перевести задачу из области нелинейности, связанной с поиском минимума корреляций, в некоторую область линейности, умышленно стимулировав широкодиверсифицированные инвестиции по всему рынку (без оглядки на корреляцию). Достигается это путём регуляризации или усадки матриц :
где — Cov — ковариационная матрица используемая в задаче, Cov(sample) — выборочная ковариация, Cov(basis) — базисная ковариация, ламбда — параметр регуляризации, подбираемый бэк-тестом или выбираемый на каждом шаге исходя из общих характеристик матриц.
Видно, что при ламбда = 0, задача вырождается и приобретает характер задачи в некоторых априорных предположениях о характере взаимосвязи активов, заданных матрицей Cov(basis).
Этими априорными предположениями (базисом ковариации) могут выступать :
- Предположение о нулевой корреляции активов (Sharpe,1963)
- Предположение о некотором общем уровне взаимосвязи для всех активов (Ledoit & Wolf,2003)
- Отсутствие каких либо априорных предположений и использование эмпирического базиса в целях усадки (PCA, задача настоящей работы)
Забегая вперёд, отметим, что, в целом, результаты наших испытаний по этим методам соответствуют результатам
сторонних авторов.
- Динамические модели условных корреляций и функции сглаживания
Второй подход, предложенный Р.Энглом (
Theoretical and empirical properties of dynamic conditional correlation multivariate GARCH,
2001), заключается использовании динамических моделей корреляций (DCC) c использованием различных сглаживающих фильтров (например, фильтра Калмана или скользящей средней). В этом подходе используемая ковариационная матрица рассчитывается как:
Это обобщённое уравнение совмещает в себе оба подхода — при бетта = 1/n и альфа+бетта =1, оно вырождается в уравнение усадки матриц, рассмотренное ранее, а при других значениях дополняет усадку фильтром Калмана ( в зависимости от соотношений альфа и бетта) и динамической моделью ковариации, зависящей от коэффициентов вектора бетта.
- Оценка качества моделей при решении тестовой проблемы
В качестве исходных данных для OOS теста моделей мы взяли фондовый рынок США, представленный 64 активами за период с 08.09.11 до 11.09.18. В качестве базовой модели оценки доходности — математическое ожидание IS выборки, рисков — модель на основе
Bipower Variation. То есть самый простой и из всех возможных методов. Период наблюдений — 120 дней, минимальный из всех эффективных периодов, период инвестирования — 60 дней.
Апостериорный анализ возможностей портфельного инвестирования утверждает, что на выбранном интервале времени достижимы портфели с годовым коэффициентом Шарпа 1.32, в то же время базовая модель без преобразования ковариационных матриц достигает уровня качества не более чем 0.95.
Таблица результатов тестов.
Из таблицы видно, что DCC (dynamic conditional covariation) модели в среднем выигрывают у CCC (constant conditional covariation) моделей. При этом стандартные процедуры усадки работают слабо удовлетворительно и почти не имеют эффекта. Модель Шарпа, при этом, превосходит модель Ледойт-Вульфа, вероятно из-за некоторой, присущей ей дискретности, связанной с не завышением ковариаций слабо коррелированных активов и слабым снижением ковариации сильно коррелированных активов. Устранить этот недостаток Ледойт-Вульф модели с сохранением всех её преимуществ (в качестве априорного предположения вводится ненулевая корреляция, что лучше соответствует действительности) позволяет более сложная факторная модель (Principal Component Analysis), разделяющая активы на группы слабо и сильно коррелированных с текущими движущими рынок факторами.
К самой же ков. матрице нужно применять другие алгоритмы, например КNN, раскладывая активы в коррелированные и не-коррелированные группы. То есть, своего рода, бинаризация ковариационной матрицы.
Как использовать SSA в целях разложения самой ков. матрицы я на сегодняшний день не представляю.
SVD разложение аппроксимирует строки матрицы. Если вы применяете его к траекторной матрице, как положено, то получаете мощность некоторого сигнала и реакцию каждой акции на этот сигнал (например цены на нефть).
Как только вы применяете SVD к ковариационной матрице, то получаете глупость, так как ковариационная матрица не имеет некоторой строковой структуры.
Представьте, что у вас в качестве актива 1 — нефть, которая определяет цену 2 актива — акций Роснефти. Корр.матрица, соответственно: [ 1, 0.5; 0.5, 1 ]; Всего одна Г.К + 1 шумовая часть.
А теперь разложим эту матрицу по SVD и получим две ортогональных Г.К. — [0.7, 0.7] и [-0.7, 0.7].
Итого, восстановленная матрица по 1-ой Г.К. будет выглядеть так :
[ 0.75, 0.75; 0.75, 0.75 ]
То есть совершенно неверное решение! (Не то, которое предполагалось).
А если бы вы повернули Корр.матрицу на 45 градусов, чтобы в ней появилась построчная структура, то да — вы бы получили то, что хотели, а именно 1 Г.К без шума.
Ясно, что идеального совпадения не будет, также ясно, что ЛЮБАЯ регуляризация искажает матрицу.
P.S. У Вас, кстати, матрица не ковариационная, а корреляционная.
Возникновение улыбки волатильности в данном случае может быть просто следствием дисбаланса покупателей и продавцов, использующих в своих оценках формулу Б-Ш и, как следствие, саму улыбку.
Что касается Марковица, то всё опять же зависит от задачи. Если вы — свободный частный трейдер — то… побить индекс портфелем Марковица вам не удастся. И первые мои опыты показывали именно это. Если вы управляющий портфелем крупного банка, у которого на балансе акции Газпрома на 2 трлн. рублей в качестве прямых инвестиций и в вашу задачу входит только диверсификация рисков этой, конкретной прямой инвестиции (с учётом доходности) — то Марковиц вам вполне эту задачу решит и сделает это лучшим образом.
Это совершенно не меняет дело.
1. Оценки прошлой доходности не обязательно должны использоваться в качестве прогноза. Я тестировал несколько фундаментальных стратегий и неожиданно получил пренеприятную проблему — сильный (неконтролируемый, слабоконтролируемый) рост рисков.
Иными словами, Марковиц на прошлых доходностях это только частный случай портфельной оптимизации.
2. Вопрос не в том, что рынок нестационарен, вопрос в том — мешает ли эта нестационарность конкретным методам. Если рынок, например, состоит из интервально-стационарных процессов с некоторым временем жизни (экспоненциально распределённым), то это уже позволит работать на нём разнообразным трендовым стратегиям в определённом интервале окон.
Если на рынке наблюдается GARCH / ARCH, то это тоже не нанесет большого ущерба портфелям Марковица — качество работы резко снизит, но правильное решение в неправильное не превратит.
Собственно, в этом вся и закавыка — проплыть океан нестационарных айсбергов, не столкнувшись ни с одним из них.
Да, CAPM модель изначально строится на допущении, что портфель по Марковицу и есть рыночный портфель. А так же на допущении того, что все инвесторы рациональны и имеют именно этот рыночный портфель. И потому уже ценность актива для них определяется с точки зрения альфа и бетта коэффициента, то есть с точки зрения способности конкретного актива диверсифицировать именно рыночный портфель (а не собственный портфель инвестора, если бы этот портфель был отличен от рыночного).
Тем не менее, это не означает, что невозможно на малых капиталах собрать портфель лучше. Более того, это даже не означает, что на крупных капиталах невозможно собрать портфель лучше, так как рациональность инвесторов и преследуемые ими цели (например, прямые инвестиции) могут быть различны, что приводит к некоторым отклонениям от CAPM.
Самое смешное, что сама CAPM в собственных предположениях не должна допускать недооценённости/переоценённости активов, так как предполагает, что рынок эффективен всегда. Но у инвесторов, как минимум существуют и собственные прогнозы относительно рынка, что создаёт предпосылки для переоценки/недооценки активов по SML, и, соответственно, опровергает изначальные положения модели CAPM.
понятно
главу про кнопку «Бабло» можно не ждать