Алгоритмы маркетмейкера. Часть 5

09 апреля 2015, 11:27
|
uralpro

Продолжаем разбирать численное решение уравнения Хамильтона-Якоби-Беллмана. В прошлой части мы составили выражение для оператора $\widetilde{\mathcal{L}}(t,y,f,s,\phi)$ , в котором есть слагаемые, получить значение которых можно из реальных данных. Во-первых, что из себя представляют дифференциальные матрицы D1,D2. Это матрицы размерностью $N_F\times N_F$ , где, для D1(согласно определению в части 4) в ячейках [j,j] стоят -1, если fj<0 и 1 в остальных случаях, в ячейках [j,j+1] стоят 1, если fj<0 и 0 в остальных случаях, и в ячейках [j,j-1] стоят -1, если fj≥0 и 0 — в остальных случаях. Как составить матрицу D2, я думаю, вы догадаетесь сами, взглянув на ее определение в части 4 цикла статей.

Далее, определение для матожидания квадратичного и линейного изменения цены:

$\mathbb{E}_td[P,P]_t=(\frac{1}{4}\lambda^J_1+\lambda^J_2)dt$ , где $\lambda^J_1,\lambda^J_2$ — интенсивность скачков цены на полшага и один шаг соответственно.

$\mathbb{E}_tdP_t=(\lambda^J_1\frac{\delta}{2}(2\psi_1(F_t)-1)+\lambda^J_2\delta(2\psi_2(F_t)-1))dt$ , где $\psi_1,\psi_2$ — вероятности скачков цены — см. часть 2.

Оператор воздействия величины спреда на функцию владения:

$\mathcal{L}^S\circ v(t,y,f,s)=\Bigg(\sum\limits_{j=1}^3 \rho_{ij}[v(t,y,f,j\delta)-v(t,y,f,i\delta)]\Bigg)\lambda^S$ , где ρij- элементы матрицы переходов марковского процесса скачков спреда, λS- интенсивность этих скачков.

В выше приведенных формулах все интенсивности могут быть получены из рыночных данных путем простого расчета, например, можно подсчитать количество скачков спреда за определенный промежуток времени и параметр λS будет равен этому количеству, деленному на длительность промежутка в секундах. Интенсивности $\lambda^J_1,\lambda^J_2$ считаются аналогичным образом для скачков средней цены стакана на полшага и один шаг соответственно. Матрицу переходов тоже легко получить, подсчитав, сколько раз спред переходил из состояния один шаг цены в состояние два шага цены, из состояния один шаг цены в состояние 3 шага цены, и т.д., заполнив элементы матрицы ρi,j, где i означает начальное состояние спреда, j — конечное состояние спреда, на главной диагонали ρii=0. Приравняв сумму элементов в одной строке к 1, получим значенияρ, как доли от общей суммы ( элементы матрицы означают вероятности переходов).

Вероятности скачков цены $\psi_1,\psi_2$ тоже найти несложно. Для этого нужно подсчитать количество скачков средней цены на полшага (для ψ1), попадающее в диапазон значений дисбаланса в каждом из интервалов [fj,fj+1], в каком-то промежутке времени, например, за один день, затем разделить величину в каждом интервале на общее число скачков. В результате получим плотность вероятности, интегрируя которую (складывая нарастающим итогом в численном варианте) в диапазоне всех значений дисбаланса f, получим исходные данные для нахождения формулы вероятности ψ1. Далее методом наименьших квадратов, используя эти данные, находим коэффициент β1 аппроксимирующей функции $\psi_1(u)=1/(1+\exp(-\beta_1 u))$ . Все то же самое проделываем для функции ψ2, только скачки цены берем на полный шаг. Таким же образом получаем формулы для вероятностей взятия лимитных ордеров в очереди заявок h(f) (см. часть 3), только подсчитывать будем количество исполненных ордеров (для бида и аска отдельно) в каждом интервале дисбаланса f.

Нам осталось определить значения $\alpha_F, \sigma_F$ из уравнения Орнштейна-Уленбека для процесса дисбаланса объемов dFt (см.часть 2). Эти параметры находятся методом максимального правдоподобия, максимизируем следующую функцию:

$$K(\theta)=-\frac{n+1}{2}\log(\pi\sigma^2_F)-\frac{f_0^2}{\sigma^2_F}-\frac{1}{2}\sum\limits_{k=1}^{n}(1-\exp(-2\alpha_F\Delta_k))-$

$-\sum\limits_{k=1}^n(\frac{(f_k-\exp(-\alpha_F\Delta_k)f_{k-1})^2}{\sigma_F^2(1-\exp(-2\alpha_F\Delta_k))})$

где fk — значение дисбаланса объема в момент времени tk,

$\Delta_k=t_k-t_{k-1}$ , n — общее число значений k.

Итак, мы можем уже написать код для численного решения методом индукции. Ниже дан листинг на C#:

        /* Функция решения уравнения HJB-QVI методом обратной индукции
         * plt - структура, в которой определены основные переменные и политики
         * plt.T - число временных точек расчета, plt.S - число значений спреда (=3)
         * plt.F- число точек расчета дисбаланса объема, plt.Y - количество значений открытой позиции
         * plt.dF - шаг величины дисбаланса объемов, plt.Fmax - модуль максимального значения дисбаланса
         * plt.ticksize - минимальный шаг цены, plt.comiss - биржевая комиссия
         * plt.w - массив значения численной функции владения
         * plt.polmk - булевый массив, определяющий, какая политика будет использована при текущих значениях [t,y,f,s]
         * если true - лимитные ордера, false - маркет ордера
         * plt.thtkq - массив объемов маркет ордеров при действии политики маркет ордеров
         * plt.thmka, plt.thmkb - массив значений 0 (выставление на лучшую цену) или 1 (выставление на шаг лучше лучшей цены)
         * при действии политики лимитных ордеров
         * maxlot - абсолютное максимальное значение открытой позиции
        */
        public static void BackwardInduction(politics plt, int maxlot)
        {
            //Двигаемся вниз по временной сетке
            for (int t = plt.T; t >= 0; t--)
            {
                //Двигаемся по сетке значения спреда
                for (int s = 0; s < plt.S; s++)
                {
                    // Определяем массив векторов оператора L (массив- по всем значениям открытой позиции,
                    //вектор оператора - по всем значениям дисбаланса)
                    double[][] L = new double[plt.Y][];
                    //Двигаемся по сетке открытых значений
                    for (int y = 0; y < plt.Y; y++)
                    {
                        // Инициализируем значения всех векторов L
                        L[y] = new double[plt.F];
                        //Вычисляем реальное значение открытой позиции из индекса
                        int yr = (int)(y - (plt.Y - 1) / 2);
                        //Двигаемся по сетке дисбаланса объемов
                        for (int f = 0; f < plt.F; f++)
                        {
                            //Реальное значение дисбаланса из индекса
                            double fr = plt.dF * f - plt.Fmax; ;
                            //Первый шаг - вычисление функции владения w в конечный момент времени T
                            if (t == plt.T) plt.w[y, f, s] = -Math.Abs(yr) * ((s + 1) * plt.ticksize / 2 + plt.commis);
                            else
                            {
                                //В остальные моменты времени находим значения векторов L (пока без умножения на 
                                // дифференциальные матрицы в первой части выражения для L)
                                L[y][f] = LV(y, yr, fr, f, s, t, plt);
                            }
                        }
                        if (t < plt.T)
                        {
                            //Перемножение матричной части и векторов L, полученных выше, в результате получаем
                            // полностью рассчитанные вектора L. plt.rmatrix - матричная часть
                            matrixmlt(plt.rmatrix, ref L[y]);
                        }
                    }
                    //Вычисление выражения M*L для определения политики маркет ордеров
                    if (t < plt.T)
                    {
                        //Двигаемся по сетке открытой позиции
                        for (int y = 0; y < plt.Y; y++)
                        {
                            //Двигаемся по сетке дисбаланса объемов
                            for (int f = 0; f < plt.F; f++)
                            {
                                //Максимальное значение контрактов, допустимое в маркет ордере на данном шаге
                                int dzmax = Math.Min(plt.Y - 1 - y, maxlot);
                                double ML = -1000000;
                                //Двигаемся по сетке объема маркет ордера
                                for (int dz = Math.Max(-y, -maxlot); dz <= dzmax; dz++)
                                {
                                    //Вычисление оператора M*L для каждого значения объема маркет ордера
                                    if (L[y + dz][f] - Math.Abs(dz) * ((s + 1) * plt.ticksize / 2 + plt.commis) > ML)
                                    {
                                        ML = L[y + dz][f] - Math.Abs(dz) * ((s + 1) * plt.ticksize / 2 + plt.commis);
                                        //Занесение в политику маркет ордеров значения объема
                                        plt.thtkq[t, y, f, s] = dz;
                                    }
                                }
                                //Если оператор M*L больше оператора L при всех исходных параметрах, выбирается политика
                                //маркет ордеров
                                if (ML > L[y][f])
                                {
                                    //Значению функции владения w присваивается значение оператора M*L
                                    plt.w[y, f, s] = ML;
                                    plt.polmk[t, y, f, s] = false;
                                }
                                // Иначе - политика лимитных ордеров
                                else
                                {
                                    //Значению функции владения присваивается значение оператора L
                                    plt.w[y, f, s] = L[y][f];
                                    plt.polmk[t, y, f, s] = true;
                                }
                            }
                        }
                    }
                }
            }
        }

       //Функция вычисления значения оператора L, без перемножения на матричную часть
        public static double LV(int y, int yr, double ft, int f, int s, int t, politics plt)
        {
            //Вычисление значений функции вероятности скачков цены на полшага и шаг psi1,2, с коэффициентами beta1,2
            double psi1res = 0;
            ClassMain.psifunc(plt.beta1, new double[] { ft }, ref psi1res, null);
            double psi2res = 0;
            ClassMain.psifunc(plt.beta2, new double[] { ft }, ref psi2res, null);
            //Вычисление матожидания изменения средней цены, plt.lj1,plt.lj2 - интенсивности скачков цены
            double Edp = plt.lj1 * (plt.ticksize / 2) * (2 * psi1res - 1) + plt.lj2 * plt.ticksize * (2 * psi2res - 1);
            //Вычисление оператора воздействия спреда на функцию владения, plt.ro - матрица переходов состояний спреда
            double Ls = 0;
            for (int j = 0; j < plt.ro.GetLength(1); j++)
            {
                Ls += (plt.w[y, f, j] - plt.w[y, f, s]) * plt.ro[s, j];
            }
            //plt.ls - интенсивность скачков спреда
            Ls = plt.ls * Ls;
            //Вычисление матожидания среднеквадратичного изменения цены
            double Edpp = (0.25 * plt.lj1 + plt.lj2);

            double gv = -10000000;
            int thmax = 1;
            if (s == 0) thmax = 0;
            double gvtemp = 0;
            //Вычисление значений вероятности взятия лимитных ордеров в очереди заявок h(f)
            //plt.ch - коэффициент в формуле для вероятности h(f)
            double hresp = 0;
            ClassMain.htfunc(plt.ch, new double[] { ft }, ref hresp, null);
            double hresm = 0;
            ClassMain.htfunc(plt.ch, new double[] { -ft }, ref hresm, null);

            //Вычисление слагаемых ga и gb в выражении для оператора L, thmax - максимальное значение, которое принимает
            // политика для лимитных ордеров - 1
            for (int i = 0; i <= thmax; i++)
            {
                for (int k = 0; k <= thmax; k++)
                {
                    gvtemp = (i * (plt.lMa) + (1 - i) * plt.lMa * hresp) * (plt.w[Math.Min(y + 1, (int)(2 * plt.Ymax)), f, s] - plt.w[y, f, s] + (s + 1) * plt.ticksize / 2 - plt.ticksize * i) +
                        (k * (plt.lMb) + (1 - k) * plt.lMb * hresm) * (plt.w[Math.Max(y - 1, 0), f, s] - plt.w[y, f, s] + (s + 1) * plt.ticksize / 2 - plt.ticksize * k);
                    //Занесение значения 0 или 1 в политику лимитных ордеров
                    if (gvtemp > gv)
                    {
                        gv = gvtemp;
                        plt.thmkb[t, y, f, s] = i; plt.thmka[t, y, f, s] = k;
                    }
                }
            }
            //Вычисление значения оператора L (без умножения на матричную часть)
            //plt.dt- шаг времени, plt.gamma - мера риска
            double lv = plt.w[y, f, s] + plt.dt * yr * Edp + plt.dt * Ls - plt.dt * plt.gamma * yr * yr * Edpp + plt.dt * gv;

            return lv;
        }

И приведу отдельный листинг вычисления матричной части выражения для оператора $\widetilde{\mathcal{L}}$ :

        //Вычисление матричной части выражения оператора L
        public void MatrixSolve()
        {
            //Дифференциальные матрицы D1,2 и матрица идентичности I.
            double[,] D1 = new double[F, F];
            double[,] D2 = new double[F, F];
            double[,] I = new double[F, F];

            //Заполняем матрицы на сетке F x F
            for (int i = 0; i < F; i++)
            {
                int k = 0;
                if (i <= (F - 1) / 2) k = i;
                else k = i - 1;
                D1[i, k] = -1 / dF; D1[i, k + 1] = 1 / dF;
                if (i == 0)
                {
                    D2[i, i + 1] = 2 / (dF * dF);
                }
                else if (i == F - 1)
                {
                    D2[i, i - 1] = 2 / (dF * dF);
                }
                else
                {
                    D2[i, i - 1] = 1 / (dF * dF);
                    D2[i, i + 1] = 1 / (dF * dF);
                }
                D2[i, i] = -2 / (dF * dF);
                I[i, i] = 1;
                double Ft = dF * i - Fmax;

                //Вычисляем значения матричной части выражения оператора L
                //cft[1] - значение sigmaF из уравнения Орнштейна-Уленбека для Ft,
                //cft[0] - значение alfaF
                for (int j = 0; j < F; j++)
                {
                    rmatrix[i, j] = I[i, j] - 0.5*dt * cft[1] * cft[1] * D2[i, j] - dt * cft[0] * Ft * D1[i, j];
                }
            }
            alglib.matinvreport rep;
            int info;
            //Инвертируем матрицу, используя стороннюю библиотеку alglib
            alglib.rmatrixinverse(ref rmatrix, out info, out rep);

        }

На этом цикл статей по алгоритмам маркет мейкера завершен. Прошлые части статьи — в моем блоге или на сайте. Можно ли применить рассмотренную стратегию в реальной торговле? Несомненно, да. Вместо дисбаланса объема F возможно применение и других, более сложных сигналов, сохранив у них следование процессу Орнштейна-Уленбека, что не изменит нахождение параметров процесса. И в таком случае получим несколько разных HFT алгоритмов со всеми их преимуществами. Насколько хорошо дисбаланс объемов предсказывает цену исследовал пользователь r0man на моем сайте на примере фьючерса Si, за что ему огромная благодарность, вот что у него получилось:

На оси ординат — доля правильных предсказаний (вероятность), на оси абсцисс — количество тиков цены с момента замера дисбаланса. Таким образом достоверно утверждение о возможности предсказания цены актива в зависимости от дисбаланса объема в стакане.

Буду рад вашим отзывам по данным статьям и указаниям на ошибки, если таковые присутствуют в тексте.

808 | ★30

35 комментариев

самый интересный вопрос у вас на сайте, про то, работает ли этот метод предсказания цены на практике?

Профессор Преображенский

09 апреля 2015, 11:38
Ответить

Профессор Преображенский, в конце поста как раз дана оценка

uralpro

09 апреля 2015, 11:40
Ответить

uralpro, вот про это я и говорю.

Профессор Преображенский

09 апреля 2015, 11:42
Ответить

uralpro, что на графике за вероятность? Это кол-во правильных предсказаний цены, или, что? ))

zag1

09 апреля 2015, 13:38
Ответить

Zangpo, это доля правильных предсказаний. Если вероятность равна 0,7 то, например, из 10 предсказаний 7 верные

uralpro

09 апреля 2015, 13:48
Ответить

uralpro, на аутофсемпл и на тесте график которого приведен одно и тоже показывает?

zag1

09 апреля 2015, 14:08
Ответить

Zangpo, это не график прибыльности алгоритма, это просто зависимость приращения цены от одного сигнала — дисбаланса объема, на выборке из 220 тыс. наблюдений (согласно r0man)

uralpro

09 апреля 2015, 14:15
Ответить

uralpro, я и не пишу о прибыльности. :-)

zag1

09 апреля 2015, 14:39
Ответить

Zangpo, причем тогда тестирование out of sample?

uralpro

09 апреля 2015, 14:41
Ответить

uralpro, заглядывание «в будущее», аутофсемпл показывает, а не тот период на котором код работал и 50‰ показал.

zag1

09 апреля 2015, 14:43
Ответить

Zangpo, на моем графике нет тестирования out of sample, потому что здесь нет никакой оптимизации параметров по выборке in sample. На графике приведена точность гипотезы о том, что при дисбалансе объемов большего некоторого порога (best ask volume > bid volume) цена понизится (и наоборот) через определенный интервал времени, выраженный на графике через количество тиков после момента замера дисбаланса. Например при минимальном пороге дисбаланса в 100 контрактов по Si и интервалом предсказания 100 тиков будут следующие результаты

На приведенном в статье графике порог дисбаланса зафиксирован, а интервал предсказания меняется. Построен он лишь для того, чтобы понять применим ли алгоритм вообще и на каких промежутках времени. Сам же алгоритм работает (должен работать) немного тоньше и расчитывать оптимальные параметры дисбаланса для каждого момента времени, для каждого значения спреда, для каждой стратегии входа, выхода в зависимости от открытой позиции.

r0man

09 апреля 2015, 16:37
Ответить

r0man, а зачем столько формул для этого? Порог объкма = объем бид-объем аск.->тестирование. Если тестирование показывает что есть прибыль, задача решина. Про подгонку я и писал, т.к. в код вникать и статью читать долго, т.е. вы ничего за период всего графика не считали что-бы потом вставить в функцию которая считает с первого бара?

zag1

09 апреля 2015, 17:27
Ответить

Zangpo, а вы почитайте. Все формулы нужны, чтобы понять, что делать дальше с позой. Кроме того, в статье есть оговорка в конце, что «Вместо дисбаланса объема F возможно применение и других, более сложных сигналов, сохранив у них следование процессу Орнштейна-Уленбека, что не изменит нахождение параметров процесса.»

r0man

09 апреля 2015, 18:05
Ответить

r0man, не вижу причин читать эту статью, не хочу. ;-) Зачем в статье какой-то дополнительный сигнал, если уже есть известный процесс, я НЕ ЗНАЮ :-) Процесс О-У описывает Броуновское движение с бесконечным ускорением частицы, т.е. сам по себе дает полную описательную функцию, без сигналов, но дкмаю, если есть некоторое «целевое» направление использования О-У как основу, и потом изобретение для этой основы оптимальной стратегии то, да, и ваши 50% точности тогда оправдываются — т.к. не пользователь стратегии рулит рынком, а пользователь подстраивается под рынок. Маркетмейкеры отношения к этой стратегии не имеют. Все в "" и imho!

zag1

09 апреля 2015, 18:45
Ответить

Zangpo, разговор слепого с глухим получается.

r0man

09 апреля 2015, 19:21
Ответить

r0man, Выскажу свое мнение — то что вы закодили пример интересной работы по программированию и вычислению, но, графи предикта который меняется от 75 до 65% говорит что не все еще доделано, т.к. вероятность нестабильна и почему-то не самая большая из возможной. 100 тиков — реально торговать на тиках? Сколько тиков, по времени идет вычисление — хватает ли 100 или 300 тиков (думаю мало)?

zag1

09 апреля 2015, 19:51
Ответить

Zangpo, код в статье не мой. Мой только график в конце и причем он примитивный ведь совсем. Не знаю зачем вы за него уцепились. В самих статьях от uralpro намного большего тем для обсуждения. Что касается 100 тиков, то это опять же для оценки, чтобы не оперировать временем как в статье. Ко временной оценки можно перейти посчитав интенсивность сделок в секунду:
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.00 3.00 8.00 12.74 17.00 355.00:

r0man

09 апреля 2015, 20:07
Ответить

Профессор Преображенский, т.е. в уралпро, который вы продаете за 10 с копейками тыс. рублей алгоритм, который описан Джанмингом Ху? Правильно понимаю:)?

Профессор Преображенский