“ЖУРНАЛ РАДИОЭЛЕКТРОНИКИ” N 12, 2012 |
УДК 004.93'11, 004.93'12
МЕТОД ОБНАРУЖЕНИЯ ФАЗОВОЙ СИНХРОНИЗАЦИИ ЭЭГ ПОТЕНЦИАЛОВ КОРЫ ГОЛОВНОГО МОЗГА НА ОСНОВЕ ЭМПИРИЧЕСКИХ ФУНКЦИЙ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ [1]
В. Е. Анциперов, A. C. Абрамов
Институт радиотехники и электроники им. В.А. Котельникова РАН,
Московский физико-технический институт (государственный университет)
Получена 18 декабря 2012 г.
Аннотация. В работе представлен метод обнаружения фазовой синхронизации частотных компонент ЭЭГ потенциалов коры головного мозга. Метод позволяет осуществлять обнаружение синхронизации как в усреднённом сигнале, так и в отдельных (single-trial) откликах на внешние стимулы. Предложенный метод основан на анализе эмпирической функции распределения вероятностей фаз - ЭРФ, в частности, изменчивости ее наклона. Обсуждаются полученные экспериментальные результаты, показано, что они хорошо согласуется со сложившиеся на сегодняшний день представлениями.
Ключевые слова: ЦОС, фазовая синхронизация, анализ ЭЭГ, интерфейс мозг-компьютер, интерфейс на волне Р300.
Abstract: In the paper a new method for detection EEG rhythmic components phase synchronization is proposed and investigated. It can be applied for detecting synchronization as in the case of averaged ERPs as in the single-trial ones. The method proposed is based on empirical probability distribution functions technique, particularly on function tangent slope analysis. Experimental results and their compliance with modern brain investigations are also under discussion.
Keywords: DSP, phase synchronization, EEG analysis, brain-computer interface, P300 (P3) wave.
Введение
Проблеме ИМК – интерфейса мозг-компьютер (brain-computer interface – BCI) на сегодняшний день придается большое значение [1,2]. В прагматическом контексте под ИМК подразумеваются ряд нейро-технологий, способных обеспечить человеку коммуникацию с внешними электронными и электронно-механическими устройствами без использования мышечных усилий, и даже при отсутствии периферической иннервации [3]. Применение ИМК технологий в различных областях – повышения качества жизни инвалидов, лишённых способности двигаться, имеющих ограниченные возможности по зрению, слуху и т.д., в профессиях, связанных со значительными физиологическими перегрузками, когда оператор должен выполнить определённые манипуляции, но лишен возможности это сделать при помощи мышц, в военных разработках, в разработках новых платформ компьютерных, например, игровых приложений и т.д. – открывает качественно новые перспективы в этих направлениях.
Чаще всего ИМК реализуется на основе регистрации сигналов электрической активности головного мозга [4] посредством ЭЭГ – электро-энцефалографических измерений. Хотя для ИМК могут использоваться и другие сигналы, отражающие активность мозга: магнитоэнцефалограмма (МЭГ), электрокортикограмма (ЭКоГ), импульсная активность нейронов, распределение и интенсивность кровотока в мозге и т. д., однако наибольшее число исследований все-таки ориентированы, ввиду целого ряда причин [4], на использования ЭЭГ.
Одна из наиболее эффективных, основанных на ЭЭГ разновидностей технологий ИМК, это «интерфейс на волне Р300» [3,4]. В рамках этой технологии реализуется управление компьютером с помощью внимания к «нужным» стимулам. Именно, пользователь формирует свои команды, мысленно отмечая зрительные стимулы, предъявляемые в определенной позиции, и стараясь не обращать внимания на стимулы в других позициях. Стимулы обычно представляют собой кратковременное увеличение яркости небольшого объекта — например, ячейки таблицы с буквой, картинкой и т. п. Приблизительно через 300 мс после стимулов, на которые мысленно отвечает пользователь, в его электроэнцефалограмме (ЭЭГ) наблюдается высокоамплитудная позитивная волна Р300; некоторые другие компоненты реакции мозга могут также иметь повышенную амплитуду (вызванный потенциал). По этим признакам классификатор распознает «кнопку», которую хочет «нажать» пользователь, и в результате компьютер выполняет соответствующую команду или (при наборе текста) вводит соответствующую букву [4].
Изложенный ИМК «интерфейс на волне Р300» представляет собой некоторое потенциально возможное решение, реализация которой встречается с большим количеством практических трудностей. Первая проблема состоит в том, что помимо волны Р300, представляющей собой отклик нейронов на стимул, в сигнале ЭЭГ содержится фоновая, не связанная со стимулом активность (см. рис.1). Рассматривая Р300 как сигнал, а фон как шум, мы имеем задачу обнаружения сигнала в шумах, причем, в данном случае с очень низким отношением сигнал/шум. В этой ситуации, казалось бы, максимально эффективными, потенциально наиболее помехоустойчивыми должны были бы оказаться известные в теории передачи сообщений методы когерентного приема, ориентированные на известную (300 мс) задержку (фазу) сигнала. Однако, здесь возникает вторая проблема, связанная с тем, что волна Р300 весьма изменчива и для ее надежного выявления традиционными методами ЦОС приходится предъявлять каждый из типов стимулов многократно с тем, чтобы после усреднения получить менее вариабельные результаты [5]. Очевидно, что с практической точки зрения подобная процедура нежелательна, и было предпринято много попыток разработки специальных методов обнаружения Р300 в экспериментах с одиночными (single-trial) откликами. Наиболее перспективными сегодня считаются методы, основанные на режекторной фильтрации, выделении главных компонент, вейвлетном подавлении шума, автоматическом разделении сигналов и т.д.[5]. Сегодня по всем перечисленным методам ведутся масштабные исследования, однако, приемлемая с практической точки зрения методология до сих пор все еще не разработана.
Рис. 1. Модельное представление возникновения вызванного потенциала ЭЭГ (Р300) как реакции на внешний стимул (вертикальный маркер): в верхней части рисунка – ансамбль реализаций, в нижней – среднее по ансамблю. a) записи фоновой (спонтанной) активности (шума): при усреднении взаимно сокращаются; b) предполагаемая форма вызванного потенциала (сигнала): при усреднении в целом не меняется; c) модельные записи ЭЭГ– фон маскирует вызванный потенциал: при усреднении происходит увеличение отношения сигнал/шум.
1. Принципиальная основа предлагаемой методики обнаружения вызванных потенциалов
Нами в основу методики обнаружения вызванных потенциалов положена простая модель структуры ЭЭГ записи. Эта модель, в отличие от традиционной, разделяющей ЭЭГ на полезный сигнал и фон (см. рис.1), предполагает, что ЭЭГ состоит из набора колебательных компонент (не обязательно представленных классическими θ, δ, α, β, γ и т.д. ритмами) с некоторыми фиксированными амплитудами и случайными фазами. При этом все интересующие нас компоненты рассматриваются на равных основаниях: мы не пытаемся их подразделять на полезные и на мешающие. Другими словами предполагается, что характер текущего ЭЭГ фрагмента определяется преимущественно фазовыми соотношениями колебательных компонент, нежели их амплитудной манипуляцией. Так, например, если фазы компонент распределены независимо и равномерно, то будет получен шумоподобный фрагмент, моделирующий спонтанную (фоновую) активность. Если же случайные фазы группируются около некоторой медианы, то результирующий сигнал будет иметь вид достаточно регулярного колебания, моделирующего вызванные (стимулированные) потенциалы или, например, эпилептический разряд. Обсуждаемая модель иллюстрируется приведенным на Рис.2 примером, где слева и справа изображена сумма ~ 20 косинусоид, нo, если слева они суммируются в фазе, то справа они проссумированы со случайными фазовыми набегами.
Рис. 2. Модельное представление фазово-манипулированного многокомпонентного сигнала, представленного суммой M=20 косинусных компонент. a) все компоненты имеют одинаковую начальную фазу (нулевой фазовый сдвиг в t=500): модель регулярного (вызванного) потенциала; b) фазы компонент абсолютно случайны (равномерно распределены на 0-2π): модель спонтанной активности.
Предложенная модель, отличаясь от традиционной, предполагает и нестандартные методы обработки ЭЭГ записей с целью обнаружения, измерения, дискриминации вызванных потенциалов. В частности, если, как отмечено выше во введении, традиционные методы обработки, как правило, представлены линейными либо квадратичными процедурами, в парадигме фазово-манипулированного многокомпонентного сигнала приходится ориентироваться на существенно нелинейные методы, применяемые в задачах фазовой автоподстройки (PLL), фазовой синхронизации (PS) и т.д. В данной работе обсуждаются вопросы применения к сигналам ЭЭГ метода обнаружения фазовой синхронизации компонент, основанного на эмпирической функции распределения вероятностей значений фазы (ЭРФ), и полученные при этом результаты.
2. Техническая реализация предлагаемой методики обнаружения вызванных потенциалов
Для обнаружения неслучайного фазового поведения компонент ЭЭГ, называемого далее фазовым синхронизмом, нами был предложен прямой метод построения приближенной функции распределения вероятностей фазовых сдвигов, называемой в статистике эмпирической функцией распределения [6]. Этот метод известен давно, он был популярен еще до того, как статистика и теория вероятности стали строгими математическими дисциплинами, прекрасное обсуждение этой темы (кривая Кетле) можно найти у Ван-дер-Вардена [7].
Эмпирической функция распределения фазы – ЭРФ строится с помощью выборки найденных компонентных фаз следующим образом. Значение в произвольной точке равно эмпирической частоте события , т. е. равно количеству тех , которые меньше , деленному на . Конечно, получающийся график эмпирической функции это ступенчатая ломаная линия со скачками, по величине равными , а не гладкая кривая Кетле, которую строили в начале прошлого века. Однако, учитывая, что кривая задана на ограниченном интервале [0-2π], при большом объеме выборки разрывность ЭРФ становится почти не заметной.
Прежде, чем переходить к анализу ЭРФ, отметим, что не содержит информации о частотах, которым соответствуют те или . Поэтому ЭРФ в очень сжатой форме характеризует только наличие или отсутствие фазового синхронизма.
Для того, чтобы прояснить, каким образом с помощью ЭРФ можно обнаружить фазовый синхронизм, рассмотрим возможный вид идеализированных графиков ЭРФ. В случае равномерного распределения фаз – при полном отсутствии синхронизма – функция распределения будет выглядеть как прямая линия, ее график будет возрастать от минимальной фазы до максимальной на всём протяжении оси абсцисс [0-2π], см. Рис. 3 a). В случае абсолютно синхронизованного поведения компонент сигнала график будет иметь вид ломаной линии в виде ступеньки при некотором значении , см. Рис. 3 b). Отметим, что поскольку значение фазы по абсолютной величине принципиально не определено, скачок может оказаться в любом месте интервала [0-2π].
Рис. 3. Идеализированные ЭРФ для предельных случаев фазового синхронизма.
a) фазы абсолютно не синхронны – элементы выборки фаз имеют равномерное распределение;
b) все фазы имеют одинаковое значение – случай полного синхронизма компонент.
Для реальных записей ЭЭГ вид графиков ЭРФ будет иметь некоторый промежуточный между рассмотренными выше предельными случаями вид. При этом, исходя из выше изложенного, мы вправе ожидать, что в случае реальных наблюдений относительная равномерность наклона ЭРФ на [0-2π] должна свидетельствовать в пользу спонтанного поведения, а заметное изменение наклона на каких-то участках – о проявлении синхронизма. Для проверки этой гипотезы нами были обработаны реальные записи ЭЭГ с участками как спонтанной активности, так и стимулированных реакций. Обсуждению результатов этой работы посвящена оставшаяся часть работы.
3. Экспериментальный материал для тестирования предлагаемой методики
В качестве исходных данных для настоящей работы были взяты записи ЭЭГ, полученные авторами [8] (в рамках совместного исследования ИРЭ им. В.А. Котельникова РАН и ИВНД РАН). Записи относятся к группе из 10 человек, в возрасте от 40 до 59 лет без нейрофизиологических патологий.
В качестве внешнего воздействия использовалась трёх стимульная звуковая последовательность методики необычности стимула – oddball paradigm, которая состояла из стандартного («незначимого») стимула – тона (60% от общего числа предъявляемых стимулов), целевого («значимого») стимула (20%) и отличного от незначимого («скрытого») стимула (20%). Всего предъявлялось 200 стимулов, и они характеризовались следующими параметрами:
· незначимый – высокий тон частотой 800 Гц и длительностью – 80 мс;
· значимый – низкий тон частотой 400 Гц и длительностью 80 мс;
· скрытый – высокий тон частотой 800 Гц и длительностью – 40 мс.
Стимулы подавались в свободном звуковом поле, были одинаковой громкости на комфортном уровне (76 дБ). Стимулы предъявлялись с интервалом около 1 с в псевдослучайной последовательности.
Запись сигнала происходила с частотой дискретизации 200 Гц. Приём происходил с 21 канала (электрода) плюс «земля». Использовалась международная схема монтажа электродов 10/20.
4. Результаты тестирования методики ЭРФ обнаружения вызванных потенциалов
Проверка наличия синхронизации в сигнале ЭЭГ (наличия вызванных потенциалов) при акустической стимуляции проводилась на основе описанной выше методики – визуального анализа ЭРФ. Исходные фазы рассчитывались для каждого из ЭЭГ отведения на основе дискретного Фурье-преобразования по, как правило, = 180 точкам (окно ~ 900 мс). Записи ЭЭГ были предварительно отфильтрованы цифровым фильтром в полосе 5-40 Гц. На Рис.4, представленном ниже, можно увидеть типичный график для отведения C4 в режиме стимуляции одного из испытуемых. График хорошо аппроксимируется прямой, имеет ожидаемые незначительные неровности и соответствует классическому равномерному распределению фаз без синхронизации.
Рис. 4. Вид ЭРФ для отведения C4 в режиме стимуляции.
На графике Рис. 5. для отведения Cz того же испытуемого в том же режиме невооружённым взглядом видна выраженная неоднородность распределения фаз: высокая плотность распределения фаз в районе пи/минус пи и низкая в районе нуля.
Рис. 5. Вид ЭРФ для отведения Cz в режиме стимуляции.
Эти данные (Рис.4,5) правильно отражают сложившиеся на сегодняшний день представления о синхронизации [5]. Результаты тестирования методики ЭРФ нашли подтверждение и при анализе временной после стимульной динамики ЭЭГ. Ниже представлены графики ЭРФ на представленном выше измерении отведения Cz на временных промежутках от - 0 мс до 250 мс (a); от 300 мс до 550 мс (b); от 600 мс до 850 мс (c).
Рис. 6. Временная эволюция ЭРФ для отведения Cz в режиме стимуляции;
a) 0 мс после стимула; b) 200 мс после стимула; c) 850 мс после стимула.
На Рис. 6 мы видим распределения, близкие к равномерным, на левом (a) и правом (c) графике и выраженную синхронизацию фаз на центральном (b). Более того, визуальный анализ даёт основания полагать, что синхронизация фаз – довольно непродолжительный процесс. Большая часть эффекта исчезает уже через 300 миллисекунд после пика синхронизации фаз. Можно сказать, что время жизни «волны синхронизации» не более 300 миллисекунд, возможно гораздо меньше, однако проверка этого предположения проблематична при используемом разрешении сигнала (200 Гц), применяя визуальный подход. Здесь мы можем обозначить только верхнюю границу для данного параметра.
Выводы
Основной вывод данной работы – можно с высокой вероятностью полагать, что гипотеза фазового синхронизма верна и синхронизация фаз играет значительную роль в формировании структуры сигнала вызванных потенциалов ЭЭГ.
В данной работе представлен метод, позволяющий обнаружить наличие или отсутствие фазового синхронизма как в усреднённом сигнале, так и в отдельных (single-trial) откликах на внешние стимулы. Предложенный метод обнаружения синхронизма на основе анализа эмпирического распределения фаз ЭРФ, в частности изменчивости наклона функции ЭРФ, хорошо согласуется со сложившиеся на сегодняшний день представления о синхронизации компонент ЭЭГ.
В перспективе, дальнейшие исследования в данной области могут найти практическое применение в области создания более совершенных интерфейсов мозг-компьютер, а также в медицине, когнитивистике, криминалистике и других областях, нуждающихся в объективных и непредвзятых критериях оценки деятельности процессов, происходящих в коре головного мозга человека.
1. Brain–computer interface (from Wikipedia, the free encyclopedia). // [Электронный ресурс]. URL:
http://en.wikipedia.org/wiki/Brain_computer_interface
2. Reza Fazel-Rezai, Brendan Z.Allison et al. “P300 brain computer interface: current challenges and emergingtrends” // Frontiersin Neuroengineering, V.5, Article 14, July 2012, [Электронный ресурс]. URL:
http://www.frontiersin.org/Neuroengineering/10.3389/fneng.2012.00014/abstract
3. Ганин И. П., Шишкин С. Л., Кочетова А. Г., Каплан А. Я. “Интерфейс мозг-компьютер “на волне P300”: исследование эффекта номера стимулов в последовательности их предъявления” // Физиология человека, том 38, № 2, 2012, с. 5–13, [Электронный ресурс]. URL:
http://www.maikonline.com/maik/showArticle.do?auid=VAH0LYSH5X
4. Фролов А.А., Рощин В.Ю. “Интерфейс мозг-компьютер. Реальность и перспективы.” // Научная конференция по нейроинформатике МИФИ 2008г., Лекции по нейроинформатике 2008г., [Электронный ресурс]. URL:
http://neurolectures.narod.ru/2008/Frolov-2008.pdf
5. Benjamin Blankertz, Steven Lemm et al. “Single-trial analysis and classification of ERP components — A tutorial.” // NeuroImage, V. 56, 2011, pp. 814–825, [Электронный ресурс]. URL:
http://www.sciencedirect.com/science/article/pii/S1053811910009067
6. Kolmogaroff A., “Detenninazione empirica di una legge di distri-buzione” // Giornale Istit. Ital. Attuari. 4, 1933, p. 83.
7. Ван дер Варден Б. Л. “Математическая статистика” // Под ред. Н.В. Смирнова, М.: Изд. Иностр. Литературы, 1960, с. 84.
8. Обухов Ю.В., Морозов А.А., и др. “Динамика фазовой синхронизации потенциалов мозга, вызванных звуковыми тестами.” // Радиотехника, 2010, №9, c. 112-114. - ISSN 0033-8486, [Электронный ресурс]. URL: