"ЖУРНАЛ РАДИОЭЛЕКТРОНИКИ" N 5, 2006 |
УДК 621.396
ОСНОВЫ ИДЕНТИФИКАЦИОННЫХ ИЗМЕРЕНИЙ
Омский государственный технический университет
Получена 22 ноября 2006 г.
Рассмотрены основные понятия и определения идентификационных измерений (ИИ) сигналов. Под идентификационными понимаются такие измерения, которые позволяют количественно оценивать форму сигналов. Основным инструментом ИИ являются порядковые идентификационные шкалы, в структурном отношении представляющие собой объединение тестеров идентификационных параметров, реляционной базы данных (БД) и логического анализатора. ИИ включают технологии измерений, технологии БД и технологии принятия решений, что позволяет решать задачи интерактивного и автоматического распознавания сигналов, в том числе их объективной классификации и идентификации.
Введение
Распознавание, как информационная процедура, присуща всем живым природным объектам, является их естественной, "встроенной" функцией и направлена на адаптацию организма к условиям внешней и внутренней среды. Однако, если в живой природе функция распознавания выполняется быстро, эффективно и на интуитивном уровне, то научить техническую систему выполнять тоже самое представляет собой сложную проблему.
Существует достаточно большой круг задач, прямо или косвенно связанных с распознаванием сигналов, являющихся носителем информации о состоянии объектов или процессов. Наиболее характерными в этом отношении являются задачи, связанные с измерением формы входного сигнала, поскольку от этого зависит выбор оптимальных алгоритмов преобразования данных и вычисления именно тех параметров, которые наиболее точно оценивают исследуемые свойства объекта или процесса. Поэтому в данной работе все классы задачи распознавания сигналов сводятся к задаче измерения формы сигналов и их характеристик.
Эти измерения названы идентификационными измерениями, поскольку именно операция идентификации сигнала присутствует во всех разработанных авторами инструментах. В теории управления идентификацией принято называть определение структуры и параметров математической модели процесса или системы [1].
В теории измерений определение параметров модели (параметрическая идентификация) реализуется путем измерений с использованием специальных средств. Определение же структуры (структурная идентификация) модели производится априорно, путем прямого указания назначения данного средства измерения в его техническом паспорте. Подстройка измерительного прибора к модели исследуемого сигнала либо вообще не производится, либо производится в интерактивном режиме (в "ручную", не автоматически), путем соответствующей перенастройки системы.
Понятие измерения используется для того, чтобы подчеркнуть методологическое единство процедур количественного оценивания любой физической величины и величины, характеризуемой понятием "форма сигнала". Основное отличие между понятиями "измерения физической величины", например, электрического напряжения, и "измерения формы сигнала" состоит, в соответствии с современной теорией измерения [2, 3], в статусе измерительных шкал. Если "электрическое напряжение" измеряется по масштабной шкале, характеризующейся эквивалентностью, строгим упорядочением состояний, интервалов между ними и частных от деления состояний, то "форма сигнала" - в системе порядковых шкал, характеризующихся отношениями эквивалентности и порядка. Другими словами, порядковая шкала формы сигналов является более простой, в функциональном отношении, по сравнению с масштабной шкалой электрического напряжения. В дальнейшем, порядковые шкалы, предназначенные для количественного оценивания формы сигналов, будем называть идентификационными шкалами (ИШ). Распознаванию, как информационной процедуре, с позиции теории шкал, ставится в соответствие номинальная шкала, являющаяся шкалой самого низкого статуса и характеризующаяся лишь отношением эквивалентности. Поэтому в рамках номинальной шкалы можно формировать лишь суждения типа "равен – не равен". Однако, в этом случае нельзя ответить на основной "метрологический" вопрос: на сколько точно результирующее суждение? Такая возможность появляется только при использовании порядковых шкал. С этой точки зрения, ИШ являются инструментом "метризуемости" процедуры распознавания формы сигналов.
1. Понятия идентификационных измерений
В основу теории идентификационных измерений (ИИ) положены следующие идеи и модели.
1. Любой аналоговый (непрерывный во времени) сигнал полностью характеризуется своей формой.
2. Форма реализации сигнала является интегрированной характеристикой состояния сигнала за время наблюдения. Сигнал есть его реализация, наблюдаемая на бесконечном интервале.
3. Форма сигнала не меняется при изменении сдвига и масштаба по оси амплитуд, если при этом на интервале наблюдения сохраняется весь сигнал.
4. Форма сигнала не меняется при изменении сдвига и масштаба по оси времени, если при этом на интервале наблюдения сохраняется весь сигнал.
5. Любой аналоговый (непрерывный во времени) сигнал после равномерной дискретизации по времени частично характеризуется распределением мгновенных значений (РМЗ).
6. Любой аналоговый (непрерывный во времени) сигнал после равномерного квантования по уровню частично характеризуется совокупностью распределений временных интервалов (РВИ) каждого уровня.
7. Оба распределения (РМЗ и РВИ) в совокупности полностью характеризуют форму отдельной реализации (временного ряда наблюдений) сигнала.
8. При известной и постоянной на интервале наблюдений форме реализации сигнала, полная информация о сигнале заключена в одном из распределений (РМЗ или РВИ).
9. Понятие формы рассматривается как способ существования содержания, неотделимый от него и служащий его выражением [4]. Отсюда следует, что форма определяет информационное содержание сигнала и не связана напрямую с энергетикой этого сигнала.
Указанные положения позволяют сформулировать условия, необходимые для реализации технологий идентификационных измерений сигналов. Первое условие связано с необходимостью иметь инструменты измерения РМЗ и РВИ. Второе условие требует наличия инструментов установления логических связей количественных оценок РМЗ и РВИ с качественным состоянием сигнала.
Оба условия объединяются в особой структуре (рис. 1), названной авторами идентификационной шкалой.
Идентификационная шкала (ИШ) состоит из тестеров идентификационных параметров (IdP-тестеры), базы данных (БД) и логического анализатора (ЛА). Имена сигналов и, связанные с ними, численные оценки идентификационных параметров образуют реляционную БД. Можно сказать, что ИШ есть база данных, автоматически управляемая входным сигналом. В общем случае управление такой БД состоит в пересортировке первоначального списка имен и их фильтрации. При упорядочивании чисел (IdP) автоматически ранжируются имена (Имя_L) и, соответственно, те свойства объекта или процесса, которые эти имена и числа представляют.
Таким образом, в ИШ происходит объединение технологии измерения и технологии БД для решения задач распознавания образов сигналов. На основании рассмотренной структурной схемы введем следующее определение: Идентификационными будем называть такие шкалы, которые с помощью числовых показателей упорядочивают лингвистические характеристики, например, имена, объектов или процессов.
Поскольку имена в максимально сжатой, компактной форме отображают некоторую совокупность свойств объектов или процессов, то получается, что, во-первых, ИШ осуществляют компрессию информации и, во-вторых, реализуют количественное оценивание качественного состояния объекта исследования.
Упорядоченность числовых отметок и, связанных с ними, имен, во-первых, обуславливает возможность интерполяции положения неизвестных объектов в рамках шкалы, во-вторых, выявляет структуру связей этого объекта с эталонными объектами, представленными именами отметок и, в третьих, производит разложение имени исследуемого объекта в спектр имен эталонных отметок.
Рис. 1. Структурная схема идентификационной шкалы
С формальной точки зрения ИШ отображает некоторое множество, например, временной ряд наблюдений F(t), в число (G), называемое идентификационным – G:F(t)®G. Основным свойством этого числа является то, что оно не зависит от линейных преобразований исходного множества. Данное свойство характеризует масштабную инвариантность ИШ.
Особенностью отображения F(t)®G является его неоднозначность, при которой одно и тоже идентификационное число может принадлежать разным исходным множествам. Эта особенность, вообще говоря, присуща многим преобразованиям, связанным, например, с интегрированием или изменением размерности. Достаточно вспомнить вычисление моментных характеристик случайных сигналов, когда одинаковые числовые показатели типа математического ожидания или дисперсии, могут быть получены от сигналов разной структуры. Устранение или уменьшение неоднозначности является основной целью разработчиков систем распознавания.
Другой вариант интерпретации ИШ состоит в ее представлении в виде упорядоченного списка кортежей атрибутов со структурой: {Имя(объекта); Ранг(объекта); Значение(IdP)}. Если в кортеже отсутствует элемент <Значение(IdP)>, то получаем структуру "не измеряемой величины", которой соответствует, например, упорядоченный по алфавиту список сотрудников некоторого учреждения. Если измерить рост и упорядочить тех же сотрудников по этому показателю, то получим полную структуру кортежа, соответствующую "измеряемой величине".
В рамках данной модели операцию измерения можно рассматривать как совокупность двух процедур. Первая процедура состоит в переформатировании, в соответствии с измеренным значением идентификационного числа, первоначального списка эталонов ИШ. Вторая процедура заключается в присвоении исследуемому объекту либо имени ближайшего эталона (точечное представление) с указанием числовой оценки расстояния между ними, либо прикладывание полного списка имен эталонов, выстроенных в порядке, зависящем от измеренного идентификационного числа (спектральное представление).
Поскольку технология работы со списками относится к информационным технологиям БД, то появляется реальная возможность распространить эту технологию для обработки "классических" сигналов, представляемых временными рядами наблюдений.
Идея построения подобных ИШ для решения задач обработки сигналов была показана в работах [5-9]. Синтез ИШ является неформальной, а, следовательно, неоднозначной, многовариантной процедурой. В таких условиях наиболее важной проблемой разработки ИШ является проблема выбора системы идентификационных числовых показателей, которые бы, с одной стороны, адекватно отображали на шкалу особенности исследуемых сигналов, а с другой – имели бы ясный "физический" смысл.
2. Классификация средств идентификационных измерений
В основу построения средств идентификационных измерений (СИИ) положены два основных принципа:
1. Масштабная инвариантность отображения множества (сигнала) F(t) в число G, при которой Id[F(t)] = Id[A + BF(Ct)] = G, где Id[..] – операция идентификации сигнала, A, B, C – постоянные коэффициенты.
2. Эквивалентность форм характеристик сравниваемых сигналов, при которой, если G1 = Id[F1(t)], G2 = Id[F2(t)], то при G1 = G2, имеем F1(t) ≡ F2(t), где знак "≡" означает, что эти сигналы эквивалентны в идентификационном смысле.
Аналогом данного принципа в измерительной технике является компарирование сигналов переменного тока сигналами постоянного тока, реализуемое, например, на базе электротепловых преобразователей.
Классификация СИИ представлена в таблице 1.
Тестеры идентификационных параметров (IdP-тестеры или кодеры) являются элементарными средствами идентификационных измерений. В тестерах осуществляется преобразование массива чисел в одно, идентификационное число. Алгоритм подобного преобразования служит математической моделью тестера. Этот алгоритм может быть задан либо аналитически, либо в виде некоторой программной структуры.
Таблица 1
Наименование СИИ
Функция преобразования вход-выход
Тестеры (кодеры)
Сигнал (массив) – число
Сигнал (массив) – вектор
Конвертеры (декодеры)
Число – сигнал (массив)
Вектор– сигнал (массив)
Трансдъюсеры (преобразователи)
Cигнал (массив) – сигнал (массив)
Генераторы (формирователи)
Имя – сигнал (массив)
Основными требованиями к IdP-тестерам являются:
а) независимость показаний от линейных преобразований исходного множества;
б) однозначность отображения множеств, принадлежащих заданному диапазону изменения их имен.
Оба этих требования определяют общее правило построения любых других СИИ, которое формулируется следующим образом: "Допустимы любые операции с формой сигнала, если при этом значение идентификационного параметра не изменяется".
Тестеры являются универсальными СИИ в том смысле, что позволяют количественно оценивать форму выборочных реализаций массивов числовых данных произвольной физической природы и являются составными частями более сложных инструментов.
Эти же тестеры можно использовать для измерения формы не только временных, но и спектральных и (или) корреляционных характеристик сигналов. В этом случае получится набор из нескольких идентификационных параметров, которые могут рассматриваться как проекции некоторого идентификационного вектора.
Таким образом, можно устранить или существенно уменьшить неоднозначность, возникающую при отображении множества в одно число. Тестеры, на выходе которых формируется два и более идентификационных числа, будем называть векторными.
Конвертерами (декодерами) будем называть такие СИИ, в которых производится преобразование числа в сигнал (массив чисел). Функция преобразования конвертеров является обратной к функции преобразования IdP-тестеров. Условием реализуемости конвертеров служит принадлежность задаваемого числа диапазону изменения идентификационных чисел того IdP-тестера, который входит составной частью в структуру конвертера. Конвертер, имеющий два и более числовых входа, относится к группе векторных СИИ.
Трансдьюсерами (преобразователями) называются такие СИИ, на входе и выходе которых присутствует однородные величины, например, число – число или сигнал (массив) – сигнал (массив). В простейшем случае трансдьюсер представляет собой последовательное соединение IdP-тестера и конвертера. Виды (имена) сигналов на входе и выходе трансдьюсера могут отличаться, но внутри его (выход IdP-тестера и вход IdP-конвертера) соблюдается условие равенства идентификационных параметров IdP-тестера и IdP-конвертера.
Генераторами (формирователями) называются такие СИИ, которые создают на своем выходе сигнал (массив), соответствующий входному имени некоторого виртуального сигнала (массива). В отличие от других СИИ, генераторы содержат, явным образом, в своей структуре базу данных. Поэтому генераторы в наиболее полном виде представляют структуру (рис. 1), называемую идентификационной шкалой.
Идентификационными характеристиками (ИХ) будем называть такие характеристики, которые связывают, аналитически или логически, значение идентификационного параметра сигнала (выходная величина) с информативным входным параметром. К основным, идентификационным можно отнести следующие характеристики:
1. Рекогнитивная (распознавательная) идентификационная характеристика (РИХ) – такая ИХ, которая связывает значение идентификационного параметра с формой сигнала. При этом сама "форма" рассматривается как непрерывная величина, задаваемая из некоторого диапазона значений. Например, периодическая система химических элементов Д. И. Менделеева является рекогнитивной ИХ (РИХ), поскольку связывает имя химического элемента (или его порядковый номер) с атомным весом (числовым идентификационным параметром) [10].
2. Частотная идентификационная характеристика (ЧИХ) – такая ИХ, в которой значение идентификационного параметра зависит от частоты входного сигнала при постоянстве его формы. Примерами частотных ИХ (ЧИХ) могут служить зависимости некоторого идентификационного параметра от числа периодов для сигналов синусоидальной, треугольной, прямоугольной и пилообразной формы. Аналогом ЧИХ является частотная характеристика электрической цепи, например, двух или четырехполюсника.
3. Эволюционная идентификационная характеристика (ЭИХ) – такая ИХ, в которой значение идентификационного параметра зависит от соотношения интенсивностей компонент, например, спектральных составляющих, сигнала. Примером ЭИХ может служить зависимость идентификационного параметра бинарной смеси сигналов, от отношения амплитуд компонент, которое может изменяться от 0 до неопределенно большого значения (в идеале – до ∞) [11].
4. Репрезентационная (представительная) идентификационная характеристика (ПИХ) – такая ИХ, в которой значение идентификационного параметра зависит от объема выборки (времени наблюдения) исследуемой реализации случайного сигнала. Для периодического сигнала ПИХ определяет значение идентификационного параметра в зависимости от числа отсчетов, приходящихся на один период – при постоянстве формы входного сигнала.
5. Метрологическая идентификационная характеристика (МИХ) – такая ИХ, которая определяет характеристики погрешности оценок идентификационного параметра. МИХ соответствует метрологическим характеристикам классических средств измерений, что, с методологической точки зрения, и позволяет говорить об идентификационных измерениях, как о новом виде измерений.
Идентификационные характеристики являются, в той или иной степени, детерминированными моделями информации, переносимой выборочными реализациями сигналов. Поэтому, даже тогда, когда исследуется всего одна реализация сигнала можно говорить, с определенной долей уверенности, о достоверности, получаемой путем измерения, информации о форме сигнала. Однако, когда это, возможно, необходимо организовывать измерительный эксперимент так, чтобы получать множество оценок измеряемого параметра. Тем самым появляется дополнительная возможность повысить достоверность анализа за счет статистической обработки результатов измерений.
3. Применение средств идентификационных измерений
В наиболее общем виде возможности идентификационных измерений можно проиллюстрировать на примере решения классификационной задачи.
Задача классификации возникает тогда, когда необходимо неизвестный сигнал отнести к той или иной группе сигналов с известными характеристиками, например, к группе либо периодических, либо случайных сигналов. При этом желательно, чтобы периодические сигналы разделялись по форме во временной области, а случайные – по форме распределения мгновенных значений (в вероятностной области).
На рис. 2 изображен виртуальный прибор (ВП), выполненный в среде LabVIEW-7 и позволяющий решить указанную задачу.
Рис. 2. Панель управления и программный код виртуального прибора, анализирующего форму сигналов
На странице программного кода (правая часть рис. 2) размещены основные инструменты: три идентификационных тестера (два S-тестера и один K-тестер) [12,13] и база данных, выполненная в виде виртуального подприбора с именем RandPerRecog.vi. На панели управления (левая часть рис. 2) расположены элементы задания входного сигнала (массива) InputArray и отображения выходной информации (OutString, PeriodNum).
Если на входе действует периодический сигнал, то в окне OutString выводится имя сигнала, а в окне PeriodNum – его частота. При этом данный ВП различает 4 основных формы периодических сигналов (по количеству эталонов БД): прямоугольные, синусоидальные, треугольные и пилообразные.
Если на входе действует случайный сигнал, то в окне OutString выводится имя одного из следующих 8-ми распределений (по количеству эталонов БД): двумодального (2МОД), арксинусного (АРКС), равномерного (РАВН), треугольного (СИМП), нормального (НОРМ), двустороннего экспоненциального (ЛАПЛ), Коши (КОШИ) и биномиального (БИНОМ).
На рис. 3 представлена структура программного кода БД (RandPerRecog.vi), которая реализована с использованием пороговых элементов, настроенных на соответствующие диапазоны измеренных значений идентификационных параметров S1, S2 и K эталонов, а также логических устройств и переключателей, позволяющих формировать результат измерения в виде выходного суждения (имени сигнала). Границы срабатывания пороговых элементов выбраны так, чтобы обеспечить определенную устойчивость результата измерения к небольшим вариациям формы сигналов.
Проведенные авторами исследования идентификационных характеристик ВП подтверждают теоретические предположения о свойствах подобных систем в отношении их способности автоматически распознавать достаточно большое число классов сигналов.
Заключение
В работе представлены основы научных исследований, связанных со становлением нового направления в теории и технологиях измерений. Содержанием этого направления является решение проблемы измеримости формы сигналов и их характеристик. В основе решения указанной проблемы лежат следующие концептуальные и теоретические положения.
Концептуальная точка зрения постулирует систему взглядов на проблему в целом и намечает общее направление решения. В данной работе за основу принята достаточно простая идеология, которая заключается в утверждении: "Любая выборочная реализация сигнала информирует о своей структуре (форме) своими распределениями – РМЗ и РВИ. Эти распределения связаны между собой, например, как компоненты единого вектора – вектора формы." Отсюда вытекает путь решения проблемы, переводящий ее с концептуального на теоретический уровень. Этот путь связан с необходимостью научиться измерять РМЗ и РВИ, т.е. предложить пути отображения множества, каковыми являются распределения, в число.
Теоретический уровень решения проблемы измеримости формы сигналов рассмотрен в работе в достаточно общем виде – как условие постоянства формы сигнала, а, следовательно, и ее отображения (числа) при изменении масштабов по оси времени и амплитуд. Данный уровень представляется с помощью принципов инвариантности и эквивалентности.
Рис. 3. Структура программного кода модуля RandPerRecog.vi , реализующего функцию базы данных виртуального прибора (рис. 2)
Распространение методологии измерения на решение задач распознавания образов, основанное на измеримости формы сигналов, позволяет, кроме всего прочего, формировать различные технологии поверки и аттестации виртуальных средств идентификационных измерений. Таким образом, создаются условия для промышленной стандартизации интеллектуальных систем распознавания образов.
Надеемся, что обобщение и систематизация материалов исследований в области идентификационных измерений, будет способствовать становлению и развитию новых интеллектуальных технологий обработки информации.
Литература
Штейнберг Ш.Е. Идентификация в системах управления. – М.: Энергоатомиздат, 1987. - 80 с.
Пиотровский Я. Теория измерений для инженеров: Пер. с польск.- М.: Мир, 1989.
Большая Советская Энциклопедия. 3-е изд-е. – М.: Изд-во "Советская энциклопедия", 1977, с.539.
Кликушин Ю.Н. Нечеткая идентификация формы распределения вероятности. – М.: Измерительная техника, № 9, 1992.
Кликушин Ю.Н. Представление случайных сигналов с помощью принадлежностных спектров// Интернет-журнал "Журнал радиоэлектроники" - М.: ИРЭ РАН, № 2 (февраль), 2000. - http//jre.cplire.ru
Кликушин Ю.Н. Фрактальная шкала для измерения распределений вероятности// Интернет-журнал "Журнал радиоэлектроники" - М.: ИРЭ РАН, № 3 (март), 2000. - http//jre.cplire.ru
Кликушин Ю.Н. Метод фрактальной классификации сложных сигналов // Интернет-журнал "Журнал радиоэлектроники" - М.: ИРЭ РАН, № 4 (апрель), 2000. - http//jre.cplire.ru
Кликушин Ю.Н. Классификационные шкалы для распределений вероятности // Интернет-журнал "Журнал радиоэлектроники" - М.: ИРЭ РАН, № 11 (ноябрь), 2000. - http//jre.cplire.ru
Кликушин Ю.Н., Кошеков К.Т. Идентификационная шкала распределений как аналог таблицы химических элементов. - Омский Научный Вестник - Омск, Изд-во ОмГТУ, №1(34), 2006, с.139-147.
Кликушин Ю.Н., Кошеков К.Т. Исследование эволюции бинарных смесей сигналов. – Вестник КазНУ – Алматы, Изд-во КазНУ, №1(44), 2005, с.88-93.
Кликушин Ю.Н., Данилюк Р.В. Особенности идентификационной шкалы S-типа. - Омский Научный Вестник - Омск, Изд-во ОмГТУ, №1(34), 2006, с.135-138.
Кликушин Ю.Н. Количественная оценка свойств "регулярности-хаотичности" сигналов// Интернет-журнал "Журнал Радиоэлектроники" - М.: ИРЭ РАН, № 10 (октябрь), 2006 г.- 11с.- http//jre.cplire.ru
Авторы: Кликушин Юрий Николаевич,
д.т.н., профессор кафедры "Информационно-измерительная техника" Омского
государственного технического университета,
e-mail:
iit@omgtu.ru, Кобенко Вадим Юрьевич,
e-mail:
kobra_vad@rambler.ru