Когда я публикую данные по своим стратегиям, то там обычно есть таблица с помесячной доходностью. Иногда у людей возникает вопрос, который они задают в комментариях — существует ли зависимость между доходностью предыдущего месяца и следующего за ним. Иными словами, можно ли каким-то образом предсказать возможную доходность или хотя бы её знак, зная результат предыдущего месяца.
Такая задача в математике решается с помощью автокорреляции. Это по сути расчет значений корреляции между значениями ряда со сдвигом на заданную величину. Например, у нас есть значения помесячной доходности за 12 месяцев. Если мы посчитаем корреляцию этих 12 значений самих к себе, то корреляция логично будет равна 1, так как такие условные два ряда будут идентичными на 100%. Но если мы возьмем сдвиг на один месяц то есть посчитаем корреляцию между рядом с 1-го по 11-й месяц и со 2-го по 12-й, то мы сможем установить наличие или отсутствие взаимосвязи между значения предыдущего периода и последующего. Сдвиг может быть любой.
По правилам математической статистики, чтобы значения автокорреляции были корректны в принципе, необходимо удостовериться, что временной ряд (в нашем случае ряд доходностей) является стационарным. Проверить это можно разными способами. Например, построив график ACF.
Для примера я взял индекс полной доходности Московской биржи MCFTR (IMOEX + дивиденды), посчитал прирост индекса в непрерывных процентах (логарифмических), построил график ACF для определения стационарности ряда, и рассчитал корреляции со сдвигом в 1 месяц, 2 месяца и так далее до 12 месяцев. Результаты приведены на скриншотах.



Общие выводы можно изложить так:
✅ Временной ряд логарифмических помесячных доходностей MCFTR можно считать стационарным
✅ Взаимосвязь между значениями прошлых периодов с текущими есть с лагом в 1 месяц прямая и 6 месяцев обратная.
Наука такого не говорит — значимость зависит от количества данных. Значение корреляции R пересчитывает в t-статистику по формуле R * sqrt((n — 2) / (1 -R^2)). А дальше значимость надо смотреть по таблицам распределения Стьюдента с n — 2 степенями свободы
Вообще, я стараюсь не использовать для анализа автокорреляционные функции. Уж больно мутные результаты получаются в реальных ситуациях, когда предположения о стационарности неверны и, также неверны, предположения о том, что анализируемые данные не окрашены спектрально.