Пространственное кодирование информации в задаче распознования объемных объектов. Введение, часть 1.

"ЖУРНАЛ РАДИОЭЛЕКТРОНИКИ" N 4, 2001

оглавление

дискуссия

ПРОСТРАНСТВЕННОЕ КОДИРОВАНИЕ ИНФОРМАЦИИ В ЗАДАЧЕ РАСПОЗНАВАНИЯ ОБЪЕМНЫХ ОБЪЕКТОВ

В. И. Шанин, О. В. Шанин

МАТИ - Российский Государственный технологический университет им. К.Э. Циолковского

Получена 28 мая 2001 г.

В статье рассмотрены возможности метода пространственного кодирования информации с помощью решетчатых структур для решения задач распознавания объемных объектов. Здесь представлены результаты теоретических и экспериментальных исследований процессов кодирования и обработки информации применительно к этому, точностных возможностей метода, установлены требования к позиционированию объектов на входе систем распознавания, а также приведены варианты схемных решений при построении датчиков структурного освещения и систем распознавания как с электронной, так и с оптической обработкой информации.

Получены аналитические выражения для описания процесса кодирования и поведения корреляционного отклика от изменения формы распознаваемого объекта и его положения на входе системы распознавания. Установлено, что относительная точность распознавания объемных объектов находится в пределах 10-10. Для повышения точности предложено использовать дискретизацию входной информации. Результаты экспериментальных исследований достаточно хорошо согласуются с данными теоретического анализа.

Введение
1. Математическая модель кодирования с помощью решетчатых структур
2. Математическая модель процесса распознавания
3. Исследование метрологических возможностей метода
4. Требования к точности позиционирования объектов
5. Ограничения метода
6. Экспериментальные исследования метода
7. Принципы построения систем распознавания на базе пространственного кодирования информации

Введение

Внимание к методам пространственного кодирования информации обусловлено проблемой распознавания образов, а именно распознаванием трехмерных объектов [1, 2] и анализом объемных сцен по их изображениям [3]. Сложность решения этой проблемы связана, с одной стороны, с необходимостью переработки большого объема информации (для выделения основных признаков распознаваемых образов), а с другой стороны, - с недостаточной информативностью изображений трехмерных объектов. Поэтому в проблеме распознавания трехмерных образов к настоящему времени наметились два направления.

Первое направление связано с применением методов обработки информации, имеющей избыточную информативность, и оно сводится к отфильтровыванию малоинформативных составляющих [4]. Второе направление относится к ситуации, когда, наоборот, изображения обладают недостаточной информативностью, например, при высоком уровне шумов или если изображения распознаваемых образов близки между собой [3].

Известные методы пространственного кодирования информации основаны на создании вспомогательных сигналов на поверхности объемных тел, которые либо слабо связаны со свойствами распознаваемых объектов, либо вообще не связаны с ними [5].

Применительно к задачам контроля и дефектоскопии промышленной продукции, которые являются разновидностью проблемы распознавания образов, наибольшего внимания заслуживают методы пространственного кодирования информации с помощью решетчатых структур [2].

Суть этих методов состоит в получении плоского изображения, являющегося топографической картой (топограммой) поверхности исследуемого объекта. Линии на такой топограмме, называемые линиями равного уровня, - это следы сечения поверхности объекта равностоящими друг от друга плоскостями. В результате топограмма несет в себе информацию как о конфигурации изделия, так и о рельефе его поверхности. Трансформация структуры кодирующего сигнала на изображении распознаваемого объекта, обусловленная особенностями его формы, обеспечивает высокую информативность изображения при градационной его простоте - две градации (светлое и темное).

В настоящее время известны два метода пространственного кодирования информации:

- кодирование с помощью решетчатых структур [6],

- кодирование с помощью голографической интерферометрии [7,8].

В работах [6, 9] показаны перспективы применения пространственного кодирования с помощью решетчатых структур для промышленного контроля и дефектоскопии изделий со сложной формой поверхности.

Однако широкое внедрение систем распознавания на базе пространственного кодирования в практику сдерживается рядом нерешенных технических вопросов. К таким вопросам относятся метрологические возможности таких систем, требования к точности позиционирования объектов, выбор и требования к элементной базе, а также принципы построения систем распознавания с учетом особенностей обработки полученной информации. Рассмотрению перечисленных вопросов и посвящена настоящая работа.

Ниже рассматриваются математические модели процессов кодирования и анализа объектов со сложной формой поверхности в системах с корреляционной обработкой информации, теоретическая оценка метрологических возможностей таких систем и требования к позиционированию объектов на их входе, а также экспериментальные данные, варианты структурных схем систем распознавания и особенности выбора и топологии элементов в этих системах.

1. Математическая модель кодирования с помощью решетчатых структур

Принципы кодирования пространственной информации с помощью решетчатых структур поясним рис.1. Его суть состоит в пространственной модуляции плоской световой волны, освещающей объемное тело, регулярной двумерной структурой (решеткой). При этом на поверхности объемного тела формируется контрастный узор, вид которого однозначно связан с кривизной поверхности объекта, углом, под которым он освещается, и ракурсом его наблюдения. Основная особенность пространственного кодирования заключается в том, что исходная информация о форме объекта имеет вид простого по градациям (регулярных темных и светлых участков) изображения. Отсюда, как следствие, существенно снижаются требования к динамическому диапазону приемных светочувствительных приборов. Главное же достоинство такой формы представления информации состоит в ее хорошем соответствии возможностям устройствами оптической согласованной фильтрации для дальнейшего анализа [10].

Сказанное математически можно пояснить следующим образом. Любой трехмерный объект в пространстве характеризуется как поверхность

O(х, у, z)º0 (1)

Пусть этот объект наблюдается в направлении оси OZ (рис. 2). Тогда в нем можно выделить контурную и рельефную части. Контур объекта, наблюдаемого в направлении оси OZ, определим как проекцию поверхности O(x, у, z) на плоскость P, перпендикулярную к оси OZ. Обозначим его в виде функции C(x₀, у₀), которая представляет собой замкнутую линию в плоскости P. При этом положим, что

Рельеф объекта представим как функцию высоты Z точки M поверхности O(x, у, z) и обозначим как f (x, y), т. е. запишем

. (2)

Рис. 1. Схема пространственного кодирования информации с помощью регулярной двумерной структуры, где: 1 - решетка, 2 - трехмерный объект, 3 - оптическая система, 4 - плоскость регистрации изображения.

Рис. 2. Геометрическое представление трехмерного объекта как функций контура C(x, y) и рельефа , описывающегося через высоту Z точек M поверхности объекта.

При освещении объекта в соответствии с рис. 1 распределение света на выходе решетки будет иметь вид

, (3)

где X — координата, связанная с системой освещения; b — ширина щели; 2b — период решетки; comb(x) — гребенчатая функция, определяемая как

, - функция Дирака;

rect(x) — прямоугольная функция, определяемая как

Поскольку система координат освещения (X, Y, Z) cвязана с системой координат наблюдения (x, y, z) соотношением

, (4)

то выражение (3) можно записать как

. (5)

Если теперь в плоскость наблюдения поместить оптический носитель информации, то его амплитудное пропускание будет описываться выражением

, (6)

где — система координат в плоскости носителя информации, — освещенность объекта без кодирования.

Для упрощения дальнейших рассуждений примем

Кроме того, положим, что освещенность E однородна внутри контура и равна 1, а также отметим [6], что

, (7)

где N — число щелей в решетке, — коэффициенты ряда Фурье.

Подставив (7) в (6), окончательно получим

. (8)

Из анализа выражения (8) видно, что изображение на транспаранте содержит в себе информацию как о контуре, так и о рельефе исследуемого трехмерного объекта.

Введение
Раздел 1

Раздел 2

Раздел 3

Раздел 4

Раздел 5

Раздел 6

Раздел 7

Выводы
Литература