"ЖУРНАЛ РАДИОЭЛЕКТРОНИКИ" N 3 , 2000 |
ФРАКТАЛЬНАЯ ШКАЛА ДЛЯ ИЗМЕРЕНИЯ ФОРМЫ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТИ
Омский Государственный технический университет
Получена 10 марта 2000 г.
Описана технология шкалирования формы распределений вероятности случайных сигналов, основанная на представлении подобных сигналов в виде особых фрактальных функций. В качестве числового показателя, с помощью которого собственные имена распределений вероятности отображаются в порядковую шкалу, предлагается использовать характерный уровень насыщения фрактальных функций. Приведены результаты исследования метрологических характеристик полученной фрактальной шкалы распределений.
При разработке интеллектуальных средств измерений, контроля и диагностики возникают задачи автоматического распознавания и классификации объекта исследований, чаще всего представленного некоторой совокупностью выборочных значений, например, временным рядом наблюдений. В случае, когда исходные данные носят случайный характер, распознавание заключается в идентификации вида распределения вероятностей этих данных, так как именно знание этой стороны структуры входной информации позволяет выбрать оптимальные алгоритмы ее дальнейшей обработки
[1]. Современные методы идентификации распределений вероятности, подробный обзор которых представлен в работе [2], отличаются значительным разнообразием и используют для формирования критериев распознавания методы теорий вероятности и информации.Однако, ни один из известных методов не позволяет упорядочить форму распределений в виде регулярной шкалы в полном диапазоне возможных "значений" величины, определяемой рассматриваемым понятием, поскольку до сих пор не установлена методологическая основа исследований в этой области.
В данной работе представлены результаты исследования возможности создания порядковых идентификационных шкал для распределений вероятности, основанных на фрактальных моделях исследуемых процессов.
В основе эмпирических методов фрактального анализа лежит, так называемый метод Херста или (
R/S) – метод [3], ориентированный на выявление и оценку нестационарных компонент случайного процесса. Занимаясь изучением динамики стока рек, Херст предложил эмпирическую модель, обобщающую и классифицирующую многие другие природные явления, в виде зависимости отношения размаха R накопленного отклонения от среднего к среднеквадратическому отклонению S, от времени наблюдения (или объема выборки N):где: A – некоторая постоянная; Н – показатель Херста. В последствии, Бенуа Мандельброт, на основе анализа обобщенного броуновского движения, показал, что возможные значения показателя Херста лежат в диапазоне H=(0..1) и их можно использовать в качестве классификационного параметра исследуемого процесса следующим образом. Если Н<0.5, то процесс обладает знакопеременной тенденцией и называется антиперсистентным. Если Н>0.5, то процесс относится к классу персистентных, т.е. сохраняющих тенденцию к возрастанию или убыванию. При Н=0.5 имеет место случай, соответствующий классу стационарных случайных процессов.
Знание параметра Н позволяет оценить такие важнейшие показатели, как фрактальная размерность (размерность Хаусдорфа – Безиковича) D=2-H и коэффициент долговременной корреляции По существу модель (1) является новой формой представления сигналов на фрактальной плоскости, образованной координатными осями X=LOG(N) и Y=LOG(R/S), где показатель Херста Н определяет наклон аппроксимирующей прямой фрактальной линии к оси абсцисс.
Основной недостаток метода Херста состоит в том, что он не различает стационарных случайных сигналов – вне зависимости от формы распределения вероятностей показатель Херста для этих сигналов равен 0.5.
Чтобы устранить указанный недостаток предлагается модернизировать фрактальные единицы измерения, для чего: вместо параметра Херста вычислять параметр NF, названный виртуальным (кажущимся) объемом:
где:
max{xi}, min{xi} – соответственно, максимальное и минимальное значения из ряда наблюдений {x1, x2, …, xn}; X0 – оценка среднего арифметического ряда наблюдений; N – объем выборки; Kf – фрактальный коэффициент передачи; СКО – среднеквадратическое отклонение.Для ответа на вопрос: насколько хорошо виртуальный объем может выполнять функцию разделяющего (идентификационного) параметра, автором было проведено компьютерное моделирование, методика которого заключалась в следующем.
С помощью программных генераторов формировались выборки случайных чисел. Для каждой выборки вычислялась фрактальная функция (2). В свою очередь фрактальная функция усреднялась по количеству реализаций. По усредненной фрактальной функции оценивались параметры
NF и Kf, которые сопоставлялись с именем соответствующего программного генератора. Для усредненной зависимости NF=f(N) подбиралась аналитическая модель и оценивалась ее погрешность.На рис.1 представлены результаты исследований усредненных по 10 реализациям фрактальных зависимостей первого и второго порядка для двумодального (2
MOD), равномерного (EVEN), нормального (GAUS) и Коши (COSH) распределений. Наличие характерных участков насыщения на фрактальных линиях сигналов с различными распределениями и линейная упорядоченность фрактальных линий второго порядка указывают на объективное существование порядковой шкалы для распределений вероятности.Рис.1. Экспериментальные фрактальные линии первого (а) и второго (б) порядка для 2МОД (2MOD), РАВН (EVEN), НОРМ (GAUS) и КОШИ (COSH) распределений
Для обеспечения единого аналитического описания фрактальных линий всех форм распределений вероятности на плоскости X=NF, Y=N было предложено использовать модель вида:
в которой присутствует только один идентификационный параметр – N* - критический объем. Критический объем определяется как такой объем выборки, при котором фрактальный коэффициент передачи составляет » 0.707 от номинального (для данного вида распределения) значения.
Проверка согласия аналитического выражения (3) с ходом реальных фрактальных функций (рис.1,а) на качественном уровне позволяет оценить диапазоны изменения фрактальных параметров
N*, NF и Kf распределений вероятности. Так, например, при N>>N* имеем: NF=N* и Kf =0. Такая ситуация имеет место для ограниченных распределений типа 2МОД, АРКС и РАВН, у которых, соответственно, NF(2МОД)=4, NF(АРКС)=8, NF(РАВН)=12 и сами значения виртуального объема NF от объема выборки N не зависят. Другой крайний случай имеет место при N<<N*. Тогда NF» N и Kf » 1, что наблюдается для распределений типа КОШИ.На основании вышеизложенного, можно утвержать, что: все многообразие форм распределений вероятности заключено в диапазоне от 2МОД до КОШИ со значениями фрактального коэффициента передачи
Kf от 0 до 1 при уровне виртуального объема 2£ NF£ N.Результаты исследования метрологических характеристик фрактальной шкалы распределений (ФШР) представлены в табл.1. для объема выборки N=400 при 10 реализациях В качестве «оцифрованных» отметок ФШР использовались имена симметричных распределений вероятности, наиболее часто встречающихся в практике статистических измерений. Качество калибровки ФШР определяется качеством используемых эталонов – программных генераторов распределений. В данном случае для генерации некоторых видов распределений (СИМП, НОРМ) использовались приближенные, наиболее простые (с позиции программной реализации) композиционные модели вида:
СИМП – FOR I=1 TO N: P(I)=RND+RND-1:NEXT I
НОРМ
– FOR I=1 TO N: Q=0: FOR J=1 TO 12: Q=Q+RND: NEXT J: P(I)=Q-6: NEXT I. Здесь RND – функция, генерирующая равномерно распределенные в диапазоне от 0 до 1 случайные числа; P(I) – массив случайных чисел с заданным распределением. В погрешность модели входит систематическая составляющая, обусловленная смещением реальной характеристики (3) из начала координат на Nmin = 2. При введении соответствующей поправки на смещение погрешность модели будет меньше, приведенной в таблице оценки.
2МОД |
АРКС |
РАВН |
СИМП |
НОРМ |
ЛАПЛ |
КОШИ |
|
Идеализированные (оцифрованные) отметки шкалы |
4 |
8 |
12 |
21 |
36 |
100 |
400 |
Виртуальный объем NF при N=400 |
3.996 |
8.13 |
11.7 |
21.2 |
36.9 |
102,6 |
430 |
Фрактальный коэфф.-т передачи Kf при N=400 |
0.01 |
0.02 |
0.03 |
0.053 |
0.09 |
0.25 |
1.07 |
Погрешность (для Рд=0.95) модели,% |
0.14 |
1.4 |
2.5 |
1 |
2.7 |
3 |
8 |
Случ. погрешность (для Рд=0.95),% |
2.5 |
10.7 |
15.5 |
15.6 |
24 |
27 |
10 |
Пока не ясно, почему наибольшие уровни случайных погрешностей наблюдаются для отметок ФШР, принадлежащих нормальному (НОРМ) и лапласовскому (ЛАПЛ) распределениям.
Рассмотренная технология фрактального шкалирования была реализована в виде программного обеспечения распознающей системы интеллектуального анализатора сигналов. В табл.2 даны результаты работы системы в режиме самокалибровки, когда на вход подаются выборки объема N=400 в количестве 100 реализаций от внутренних эталонных генераторов. В составе этих генераторов присутствовали такие, которые формировали данные, имеющие асимметричные распределения: ЛЭКС – левоасимметричное экспоненциальное; ЭКСП – правоасимметричное экспоненциальное и РЕЛЕ – релеевское. Коэффициенты, стоящие на пересечении строк и столбцов табл.2 имеют смысл условных вероятностей принятия решения о том, какое эталонное имя присвоено выборкам, извлеченным из каждого конкретного генератора случайных чисел. Если диагональные коэффициенты равны 1, это значит, что система абсолютно правильно идентифицирует входные данные.
N=400 |
2МОД |
АРКС |
РАВН |
СИМП |
НОРМ |
ЛАПЛ |
КОШИ |
Погрешность, % |
1.00 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
АРКС |
0 |
1.00 |
0 |
0 |
0 |
0 |
0 |
0 |
РАВН |
0 |
0 |
1.00 |
0 |
0 |
0 |
0 |
0.8 |
СИМП |
0 |
0 |
0 |
1.00 |
0 |
0 |
0 |
1.2 |
РЕЛЕ |
0 |
0 |
0 |
0.43 |
0.57 |
0 |
0 |
|
НОРМ |
0 |
0 |
0 |
0.07 |
0.93 |
0 |
0 |
5.5 |
ЛЭКС |
0 |
0 |
0 |
0.04 |
0.84 |
0.12 |
0 |
|
ЭКСП |
0 |
0 |
0 |
0.06 |
0.79 |
0.15 |
0 |
|
ЛАПЛ |
0 |
0 |
0 |
0 |
0.07 |
0.93 |
0 |
2.1 |
КОШИ |
0 |
0 |
0 |
0 |
0 |
0.04 |
0.96 |
11 |
В графе "Погрешность, %" прведены оценки погрешности смещения реальных значений идентификационного параметра NF от эталонных значений этого же параметра, используемых в качестве оцифрованных отметок ФШР. Для асимметричных распределений в этой шкале эталонов нет, поэтому соответствующие погрешности определены быть не могут. Интересно, что такие асимметричные выпуклые распределения, как ЛЭКС и ЭКСП оказались "притянутыми" (примерно на 80%) к симметричному НОРМ распределению, а не к симметричному ЛАПЛ распределению, соответственно, левой и правой половинками которого ЛЭКС и ЭКСП являются.
Полученные результаты указывают на перспективность использования технологии фрактального шкалирования для идентификации распределений вероятности случайных сигналов с достоверностью не менее 90% и погрешностью не более 15% по всему диапазону (от 2МОД до КОШИ) симметричных распределений.
Таким образом, метод виртуальных объемов позволил:
ЛИТЕРАТУРА
Автор: Кликушин Юрий
Николаевич, доцент кафедры "Информационно-измерительная
техника" Омского государственного
технического университета
Адрес: 644050, Омск-50, пр.Мира, 11, ОмГТУ
Тел. (381-2) 65-37-07