Математика управления капиталом. Методы анализа риска для трейдеров и портфельных менеджеров
Шрифт:
| – 8,94 |
| – 8,93 |
| – 8,92 |
| – 8,91 |
| * |
| * |
| * |
| +8,94 |
Последнее, что мы должны сделать, прежде чем провести тест К-С, — это округлить фактические стандартные значения отобранных сделок с точностью 0,01 (так как мы используем 0,01 в качестве шага для теоретического распределения). Например, значение 6,935321 не будет иметь соответствующей теоретической вероятности, ассоциированной с ним, так как оно находится между значениями 6,93 и 6,94. Так как 6,94 ближе к 6,935321, мы округляем 6,935321 до 6,94. Прежде чем начать процедуру оптимизирования наших параметров регулируемого распределения путем применения теста К-С, мы должны округлить фактические отсортированные нормированные сделки в соответствии с выбранным шагом. Вместо округления стандартных значений сделок до ближайшего десятичного Х можно использовать линейную интерполяцию по таблице накопленных вероятностей, чтобы вычислить вероятности, соответствующие фактическим стандартным значениям сделок. Чтобы больше узнать о линейной интерполяции, посмотрите хорошую книгу по статистике, например «Управление деньгами на товарном рынке» Фреда Гема. Другие интересные книги указаны в списке рекомендованной литературы. До настоящего момента мы оптимизировали только параметры KURT и SCALE. Может показаться, что при нормировании данных параметр LOC должен быть приравнен к 0, а параметр SCALE — к 1. Это не совсем верно, так как реальное расположение распределения может не совпадать со средним арифметическим, а оптимальное значение ширины отличаться от единицы. Значения KURT и SCALE сильно связаны друг с другом. Таким образом, мы сначала попытаемся приблизительно определить оптимальные значения параметров KURT и SCALE. Для наших 232 сделок получаем SCALE =2,7, а KURT =1,9. Теперь попытаемся найти наиболее подходящие значения параметров. Этот процесс займет достаточно много времени, даже если у вас хороший компьютер. Мы проведем цикл, изменяя параметр LOC от 0,1 до -0,1 по -0,05, параметр SCALE от 2,6 до 2,8 по 0,05, параметр SKEW от 0,1 до -0,1 по -0,05 и параметр KURT от 1,86 до 1,92 по 0,02. Результаты этого цикла дают оптимальное (самое низкое значение статистики К-С) при LOC = О, SCALE = 2,8, SKEW =0 и KURT =1,86. Затем мы осуществим третий цикл. На этот раз будем просматривать LOC от 0,04 до -0,04 по -0,02, SCALE от 2,76 до 2,82 по 0,02, SKEW от 0,04 до -0,04 по -0,02 и KURT от 1,8 до 1,9 по 0,02. Результаты третьего цикла дают оптимальные значения LOC = 0,02, SCALE = 2,76, SKEW = 0 и KURT = 1,8. Мы нашли оптимальную окрестность, в которой параметры дают наилучшее приближение регулируемой характеристической функции к распределению реальных данных. Для последнего цикла мы будем просматривать LOC от 0 до 0,03 по 0,01, SCALE от 2,76 до 2,73 по -0,01, SKEW от 0,01 до -0,01 и KURT от 1,8 до 1,75 по -0,01. Результаты этого последнего прохода дают следующие оптимальные параметры для наших 232 сделок: LOC = 0,02, SCALE =2,76, SKEW = 0 и KURT =1,78.
Использование параметров для поиска оптимального f
Теперь, когда найдены наиболее подходящие значения параметров распределения, рассчитаем оптимальное f для этого распределения. Мы можем применить процедуру, которая была использована в предыдущей главе для поиска оптимального f при нормальном распределении. Единственное отличие состоит в том, что вероятности для каждого стандартного значения (значения X) рассчитываются с помощью уравнений (4.06) и (4.12). При нормальном распределении мы находим столбец ассоциированных вероятностей (вероятностей, соответствующих определенному стандартному значению), используя уравнение (3.21). В нашем случае, чтобы найти ассоциированные вероятности, следует выполнить процедуру, детально описанную ранее:
1. Для данного стандартного значения Х рассчитайте его соответствующее N'(X) с помощью уравнения (4.06).
2. Для каждого стандартного значения Х рассчитайте накопленную сумму значений N'(X), соответствующих всем предыдущим X.
3. Теперь, чтобы найти N(X), т.е. итоговую вероятность для данного X, прибавьте текущую сумму, соответствующую значению X, к текущей сумме, соответствующей предыдущему значению X. Разделите полученную величину на 2. Затем разделите полученное частное на общую сумму всех N'(X), т.е. последнее число в столбце текущих сумм. Это новое частное является ассоциированной 1-хвостой вероятностью для данного X.
Так как теперь у нас есть метод поиска ассоциированных вероятностей для стандартных значений Х при данном наборе значений параметров, мы можем найти оптимальное f. Процедура в точности совпадает с той, которая применяется для поиска оптимального f при нормальном распределении. Единственное отличие состоит в том, что мы рассчитываем столбец ассоциированных вероятностей другим способом. В нашем примере с 232 сделками значения параметров, которые получаются при самом низком значении статистики К-С, составляют 0,02, 2,76, О и 1,78 для LOC, SCALE, SKEW и KURT соответственно. Мы получили эти значения параметров, используя процедуру оптимизации, описанную в данной главе. Статистика К-С == 0,0835529 (это означает, что в своей наихудшей точке два распределения удалены на 8,35529%) при уровне значимости 7,8384%. Рисунок 4-10 показывает функцию распределения для тех значений параметров, которые наилучшим образом подходят для наших 232 сделок. Если мы возьмем полученные параметры и найдем оптимальное f по этому распределению, ограничивая распределение +3 и -3 сигма, используя 100 равноотстоящих точек данных, то получим f= 0,206, или 1 контракт на каждые 23 783,17 доллара. Сравните это с эмпирическим методом, который покажет, что оптимальный рост достигается при 1 контракте на каждые 7918,04 доллара на балансе счета. Этот результат мы получаем, если ограничиваем распределение 3 сигма с каждой стороны от среднего. В действительности, в эмпирическом потоке сделок у нас был проигрыш наихудшего случая 2,96 сигма и выигрыш наилучшего случая 6,94 сигма. Теперь, если мы вернемся и ограничим распределение 2,96 сигма слева от среднего и 6,94 сигма справа (и на этот раз будем использовать 300 равноотстоящих точек данных), то получим оптимальное f = 0,954, или 1 контракт на каждые 5062,71 доллара на балансе счета. Почему оно отличается от эмпирического оптимального f= 7918,04?
Проблема состоит в «грубости» фактического распределения. Вспомните, что уровень значимости наших наилучшим образом подходящих параметров был только 7,8384%. Давайте возьмем распределение 232 сделок и поместим в 12 ячеек от -3 до +3 сигма.
| Ячейки | Количество сделок | |
| – 3,0 | – 2,5 | 2 |
| – 2,5 | – 2,0 | 1 |
| – 2,0 | – 1,5 | 2 |
| – 1,5 | – 1,0 | 24 |
| – 1,0 | – 0,5 | 39 |
| ,sr„. – 0,5 | 0,0 | 43 |
| ь – ' 0,0 | 0,5 | 69 |
| 0,5 | 1,0 | 38 |
| 1,0 | 1,5 | 7 |
| 1,5 | 2,0 | 2 |
| 2,0 | 2,5 | 0 |
| 2,5 | 3,0 | 2 |
Отметьте, что на хвостах распределения находятся пробелы, т.е. области, или ячейки, где нет эмпирических данных. Эти области сглаживаются, когда мы приспосабливаем наше регулируемое распределение к данным, и именно эти сглаженные области вызывают различие между параметрическим и эмпирическим оптимальным f. Почему же наше характеристическое распределение при всех возможностях регулировки его формы не очень хорошо приближено к фактическому распределению? Причина состоит в том, что наблюдаемое распределение имеет слишком много точек перегиба. Параболу можно направить ветвями вверх или вниз. Однако вдоль всей параболы направление вогнутости или выпуклости не изменяется. В точке перегиба направление вогнутости изменяется. Парабола имеет 0 точек перегиба,
Рисунок 4-10 Регулируемое распределение для 232 сделок
Рисунок 4-11 Точки перегиба колоколообразного распределения
так как направление вогнутости никогда не изменяется. Объект, имеющий форму буквы S, лежащий на боку, имеет одну точку перегиба, т.е. точку, где вогнутость изменяется. Рисунок 4-11 показывает нормальное распределение. Отметьте, что в колоколообразной кривой, такой как нормальное распределение, есть две точки перегиба. В зависимости от значения SCALE наше регулируемое распределение может иметь ноль точек перегиба (если SCALE очень низкое) или две точки перегиба. Причина, по которой наше регулируемое распределение не очень хорошо описывает фактическое распределение сделок, состоит в том, что реальное распределение имеет слишком много точек перегиба. Означает ли это, что полученное характеристическое распределение неверно? Скорее всего нет. При желании мы могли бы создать функцию распределения, которая имела бы больше двух точек перегиба. Такую функцию можно было бы лучше подогнать к реальному распределению. Если бы мы создали функцию распределения, которая допускает неограниченное количество точек перегиба, то мы бы точно подогнали ее к наблюдаемому распределению. Оптимальное f, полученное с помощью такой кривой, практически совпало бы с эмпирическим. Однако чем больше точек перегиба нам пришлось бы добавить к функции распределения, тем менее надежной она была бы (т.е. она хуже представляла бы будущие сделки). Мы не пытаемся в точности подогнать параметрическое ik наблюдаемому, а стараемся лишь определить, как распределяются наблюдаемые данные, чтобы можно было предсказать с большой уверенностью будущее оптимальное 1(если данные будут распределены так же, как в прошлом). В регулируемом распределении, подогнанном к реальным сделкам, удалены ложные точки перегиба.
Поясним вышесказанное на примере. Предположим, мы используем доску Галтона. Мы знаем, что асимптотически распределение шариков, падающих через доску, будет нормальным. Однако мы собираемся бросить только 4 шарика. Можем ли мы ожидать, что результаты бросков 4 шариков будут распределены нормально? Как насчет 5 шариков? 50 шариков? В асимптотическом смысле мы ожидаем, что наблюдаемое распределение будет ближе к нормальному при увеличении числа сделок. Подгонка теоретического распределения к каждой точке перегиба наблюдаемого распределения не даст нам большую степень точности в будущем. При большом количестве сделок мы можем ожидать, что наблюдаемое распределение будет сходиться с ожидаемым и многие точки перегиба будут заполнены сделками, когда их число стремится к бесконечности. Если наши теоретические параметры точно отражают распределение реальных сделок, то оптимальное f, полученное на основе теоретического распределения, при будущей последовательности сделок будет точнее, чем оптимальное f, рассчитанное эмпирически из прошлых сделок. Другими словами, если наши 232 сделки представляют распределение сделок в будущем, тогда мы можем ожидать, что распределение сделок в будущем будет ближе к нашему «настроенному» теоретическому распределению, чем к наблюдаемому, с его многочисленными точками перегиба и «зашумленностью» из-за конечного количества сделок. Таким образом, мы можем ожидать, что будущее оптимальное f будет больше похоже на оптимальное f, полученное из теоретического распределения, чем на оптимальное f, полученное эмпирически из наблюдаемого распределения.
Итак, лучше всего в этом случае использовать не эмпирическое, а параметрическое оптимальное f. Ситуация аналогична рассмотренному случаю с 20 бросками монеты в предыдущей главе. Если мы ожидаем 60% выигрышей в игре 1:1, то оптимальное f= 0,2. Однако если бы у нас были только эмпирические данные о последних 20 бросках, 11 из которых были выигрышными, наше оптимальное f составило бы 0,1. Мы исходим из того, что параметрическое оптимальное f ($5062,71 в этом случае) верно, так как оно оптимально для функции, которая «генерирует» сделки. Как и в случае только что упомянутой игры с броском монеты, мы допускаем, что оптимальное f для следующей сделки определяется параметрической генерирующей функцией, даже если параметрическое f отличается от эмпирического оптимального f.
Очевидно, что ограничительные параметры оказывают большое влияние на оптимальное f. Каким образом выбирать эти ограничительные параметры? Посмотрим, что происходит, когда мы отодвигаем верхнюю границу. Следующая таблица составлена для нижнего предела 3 сигма с использованием 100 равноотстоящих точек данных и оптимальных параметров для 232 сделок:
| Верхняя граница | f | f$ |
| 3 Sigmas | 0,206 | $23783,17 |
| 4 Sigmas | 0,588 | $8332,51 |
| 5 Sigmas | 0,784 | $6249,42 |
| 6 Sigmas | 0,887 | $5523,73 |
| 7 Sigmas | 0,938 | $5223,41 |
| 8 Sigmas | 0,963 | $5087,81 |
| * | * | * |
| * | * | * |
| * | * | * |
| 100 Sigmas | 0,999 | $4904,46 |
Отметьте, что при постоянной нижней границе, чем выше мы отодвигаем верхнюю границу, тем ближе оптимальное f к 1. Таким образом, чем больше мы отодвигаем верхнюю границу, тем ближе оптимальное f в долларах будет к нижней границе (ожидаемый проигрыш худшего случая). В том случае, когда наша нижняя граница находится на -3 сигма, чем больше мы отодвигаем верхнюю границу, тем ближе в пределе оптимальное f в долларах будет к нижней границе, т.е. к $330,13 -(1743,23 * 3) = = -$4899,56. Посмотрите, что происходит, когда верхняя граница не меняется (3 сигма), а мы отодвигаем нижнюю границу Достаточно быстро арифметическое математическое ожидание такого процесса оказывается отрицательным. Это происходит потому, что более 50% площади под характеристической функцией находится слева от вертикальной оси. Следовательно, когда мы отодвигаем нижний ограничительный параметр, оптимальное f стремится к нулю. Теперь посмотрим, что произойдет, если мы одновременно начнем отодвигать оба ограничительных параметра. Здесь мы используем набор оптимальных параметров 0,02, 2,76, 0 и 1,78 для распределения 232 сделок и 100 равноотстоящих точек данных: