Блог им. Kot_Begemot

Критическая масса и критическое значение - большой эмпирический тест


Ранее, и в ходе дискуссий, мы получили три статистических оценки для качества аппроксимации данных длинной L (коэффициент Шарпа) со стороны случайных наборов коррелированных признаков (Features) размерностью N и корреляционной матрицей C. 


Для случайного признака :

Критическая масса и критическое значение - большой эмпирический тест

Для лучшего признака из набора :

Критическая масса и критическое значение - большой эмпирический тест


Для портфеля признаков (композитное решение) :

Критическая масса и критическое значение - большой эмпирический тест 


Где D — дисперсия прямой суммы нормированных признаков :

Критическая масса и критическое значение - большой эмпирический тест


Ne — эффективная размерность признакового пространства, обладающая аналогичной суммарной дисперсией с учетом повторений признаков:

Критическая масса и критическое значение - большой эмпирический тест 



Проведем серию испытаний для 10 000 случайно сгенерированных случайно коррелированных наборов признаков, обладающих случайной задающей пространство размерностью и  построим распределение отношения статистики критерия (sharp) к критическому уровню (Z), для доверительной вероятности 50% (медиана).



Критическая масса и критическое значение - большой эмпирический тест
Рис 1. Распределение относительной величины статистического критерия для случайно выбранного признака. Медиана = 0.998



Критическая масса и критическое значение - большой эмпирический тест
Рис 2. Распределение относительной величины статистического критерия для лучшего выбранного признака. Медиана = 1.047


Критическая масса и критическое значение - большой эмпирический тест
Рис 3. Распределение относительной величины статистического критерия для портфеля признаков (Boosting). Медиана = 1.002




Видно, что выборочная оценка медианного значения относительной статистики не отклоняется от 1 сильнее, чем на 0.047, при асимптотическом СКО порядка 0.04.


Критическая масса и критическое значение - большой эмпирический тест
Рис. 4. Слабая зависимость среднего относительных статистик в зависимости от расчетной размерности признакового пространства. 


Критическая масса и критическое значение - большой эмпирический тест
Рис 5. Оценка медианы качества аппроксимации данных различными алгоритмами в зависимости от эффективной размерности признакового пространства. 



Прил. Код Матлаб:

function BigRandomTest(N,K,L)
%BIGRANDOMTEST производит генерацию N выборок длинной L 
% и размерностью K коррелированных случайных стратегий и расчитывает их 
% статистические характеристики

X=zeros(L,K); % случайная матрица признаков
z=zeros(N,3); % результаты эмпирические
lim=zeros(N,3); % результаты теоретические
Narr=zeros(N,1); % результаты рассчета эффективной размерности

l=ones(1,K); y=ones(L,1);

warning('off','all');
for i=1:N
    X=genRS(K,L); % случайная смешанная матрица
    C=corr(X); % корреляционная матрица
    C=abs©;
    
    % Рассчитываем пределы
    lim(i,1)=(2/L)^0.5*erfinv(0.5); % шарп случайной стратегии
    
    Ne=1+0.5*(2*K-1-(4*l*C*l'-4*K+1)^0.5); Narr(i)=Ne;
    lim(i,2)=(2/L)^0.5*erfinv(0.5^(1/Ne)); % шарп лучшей стратегии из множества
    
    lim(i,3)=lim(i,2)*(K.^2/(l*C*l'))^0.5;  
    
    
    % Рассчитываем статистики
    sharp=abs(mean(X)./std(X));
    z(i,1)=sharp(1); % статистика случайной стратегии
    z(i,2)=max(sharp); % статистика лучшей стратегии
    
    a=(X'*X)\(X'*y); r=X*a;
    z(i,3)=mean®/std®; % статиситка лучшего портфеля
    if isnan(z(i,3))
       z(i,3)=0;
    end
end
warning('on','all');

%% Изображение статистик по отношению к пределам
figure; r=z(:,2)./lim(:,2); mr=median®; histfit(r,30,'gev'); 
title(['Best Sharp Statistic median : ',num2str(mr)]); 
xlabel('relation sharp to critical level'); ylabel('Frequency');

figure; r=z(:,1)./lim(:,1); mr=median®; histfit(r,30,'wbl'); 
title(['Random Sharp Statistic median : ',num2str(mr)]); 
xlabel('relation sharp to critical level'); ylabel('Frequency');

figure; r=z(:,3)./lim(:,3); mr=median®; histfit(r,30,'gev'); 
title(['Best Portfolio Sharp Statistic median : ',num2str(mr)]); 
xlabel('relation sharp to critical level'); ylabel('Frequency');

figure; r=z(:,2)./lim(:,2); plot(Narr,r,'.'); 
title(['Erorrs by effective dim']); 
xlabel('Effective dim'); ylabel('relation sharp to critical level');

figure; plot(Narr*ones(1,3),lim,'.'); legend({'Random','Best','Portfolio'}); 
title(['Critical Levels by Effective Dim ']); 
xlabel('Effective dim'); ylabel('Critical Levels');

end

% Генерация случайного набора стратегий размерности K, длинной L
function X=genRS(K,L)
Ne=ceil(rand(1,1)*K); % эффективная размерность задается случайно
A=randn(K,Ne); % случайная матрица смешивания
for i=1:K
    A(i,:)=A(i,:)/sum(A(i,:).^2);
end
X=randn(L,Ne)*A';
end






14 комментариев
Чё делать то? Них не понял.
avatar
Владимир, можно MachineLearnить дальше. До этого было нельзя. Теперь можно, но получится или нет не известно совсем.
avatar
Kot_Begemot, да можно и нужно  ML  без всех этих далеких от жизни моделей. Только попроще, покондовей. Не забывая про то, что обычный ML не любит нестационарности и непонятные помехи. 
avatar
А нельзя ли поподробнее и одновременно попроще. Чего ради это вот все? 
avatar
SergeyJu, да очень хочется показать Ташик, что на Смарте есть много других, достойных внимания трейдеров. Вот и тянет меня в искусственные интеллекты всякие. Я ей про CV и «лес», а она всё Бес, да Бес... 
avatar
Kot_Begemot, вот честно, хочется поближе к реальным данным, к правдоподобным индикатором. А Вы все Гаусса пестуете. 
avatar
SergeyJu, так я же с опционов начинал, а там ничему другому и не учат. Вот, стараюсь по мере сил... 
avatar
Kot_Begemot, да кто станет учить других зарабатывать? Вот и учат по учебникам для теоретиков. 
avatar
Kot_Begemot,  здешних смайлов не хватило на такой еще разрез!
avatar
tashik, 
avatar
Все эти головоломки  больше подходят для роботов, но что делать тем кто привык трудится руками, читая  чистый график, без всяких отвлекающих «банальных эрудиций и парадоксальных эмоций?»
avatar
Листья тополя пахнут ясенем.
Ну не фига себе !
Не, ну не фига ж себе!!!
🤔Чего?😄
avatar
Скоро платные подписки от автора полезет. В начале тень на плетень наводят, а потом Мурманск ржёт в голос от обилия лохов. )))
avatar

теги блога Kot_Begemot

....все тэги



UPDONW
Новый дизайн