c1.gif (954 bytes) "ЖУРНАЛ РАДИОЭЛЕКТРОНИКИ"  N 3, 2003

оглавление

дискуссия

c2.gif (954 bytes)

 

Методы активного зондирования сетей

 

 

А.В. Басистов, e-mail: basistov@phys.msu.ru ,

А.Н. Сандалов, e-mail: sandalov@phys.msu.ru ,

Н.А. Сухарева, e-mail: suhareva@phys.msu.ru .


МГУ им. М.В. Ломоносова, физический факультет.

 

 

 

Получена 3 марта 2003 г.

 

        Работа посвящена исследованию методов пакетной диагностики локальных и глобальных сетей, в частности, сети Интернет. Исследованы существующие методы пассивной и активной диагностики каналов передачи данных. Проведен краткий обзор программных комплексов, использующих пакетные методы, и анализ их пригодности для современных задач сетевых измерений.

        Разработан и создан программный комплекс сетевых пакетных измерений ANNET-МГУ. Приводится описание комплекса и его основные характеристики. Обсуждаются результаты измерений информационно-вычислительной сети (ИВС) физического факультета МГУ, полученные при помощи программного комплекса ANNET-МГУ.

        Установлено, что пакетными методами, собирается информация, которая при соответствующей обработке позволяет провести исследования основных физических характеристик канала передачи данных, таких как: распределения плотности вероятностей времён обхода канала, минимальное, среднее, дисперсию и т.д. для этих времён, и, соответственно, пропускная способность канала и всех его сегментов в отдельности. Анализ полученных результатов измерений показал, что данные экспериментов стационарны и повторяемы.

 

  1. Введение

  2. Модели пакетного зондирования

  3. Управление зондирующим потоком

  4. Свойства временных рядов одноуровневого пакетного зондирования

  5. Литература

 

1. Введение.

        Для измерения физических характеристик каналов передачи данных, можно разработать и создать специальные технические устройства, но более привлекательным, на наш взгляд, является возможность реализации программного их измерения, на основе уже интегрированных в системы связи стандартных устройств, не привлекая при этом никаких дополнительных аппаратных средств. Существующие для этого методы, получили название – пакетные методы. Это означает, что в качестве зондирующего сигнала канала передачи данных в телекоммуникационных сетях, выступают сформированные нами пакеты. Пакет представляет собой набор данных, передаваемый по определённому маршруту.

        Использование пакетов в качестве зондирующего сигнала даёт возможность проанализировать уже интегрированное в канал оборудование, предназначенное для передачи и обработки пакетов. Так как пакет является основным элементом формирования потока данных в сетевых структурах, то по этой причине наиболее общие свойства каналов нужно определять по отношению к потокам пакетов.

        Для технологии пакетного зондирования выделены и обоснованы основные параметры каналов передачи данных, называемые метриками качества работы Интернет протокола [1]:

    1. Доступность.
    2. Односторонняя задержка и уровень потерь.
    3. Двусторонняя задержка и уровень потерь.
    4. Вариация задержки.
    5. Типы потерь.
    6. Перемешивание пакетов.
    7. Скорость передачи данных.
    8. Пропускная способность.

Параметр доступность определяет возможность одного узла сети послать пакет другому узлу, так, чтобы пакет был принят этим узлом.

Измерение односторонних задержек и уровня потерь обусловлено несколькими причинами:

1) Некоторые приложения плохо работают, а порой не работают вообще, если задержка или уровень потерь становятся выше определённого порога.

2) Сильный разброс в значениях задержки или высокие уровни потерь делают сложным или невозможным работу протоколов передачи в режиме реального времени.

3) Большие величины задержки или уровня потерь усложняют возможность транспортных протоколов поддерживать высокие скорости передачи.

Измерение односторонней задержки помимо двухсторонней задержки обусловлено:

1) Наличием асимметрии в путях передачи Интернета, когда пакеты в прямом направлении идут по одному пути, а в обратном направлении по другому пути, зачастую по другим сетям с другой архитектурой.

2) Даже если пути симметричны, они могут иметь полностью отличные характеристики в прямом и обратном направлении.

3) Качество работы приложений может зависеть главным образом от одного направления и в меньшей степени от обратного. Например, если в прямом направлении передаются данные, а в обратном лишь подтверждения.

Двусторонние задержки и уровень потерь определены аналогично односторонним, но с учётом обратного пути пакета.

Для параметра вариация задержки часто используется другое название – джиттер. Этот термин чаще всего используется, когда говорят о вариации сигнала, относительно какого-либо опорного сигнала, тогда же используется и термин – блуждание. Другое использование данного термина принадлежит вариации какой-либо величины (например, задержки) относительно её минимального, или среднего значения.

Определение вариации задержки пакета возможно только для пакетов внутри потока пакетов. Вариация задержки для пары пакетов в потоке определена для выбранной пары в потоке, идущем от одной измерительной точки до другой. Вариация задержки – это разница между односторонними задержками этих пакетов.

Типы потерь – параметр, определяемый функцией потерь, по которой можно судить о характере потерь в канале передачи данных. Для этой функции вводятся: период потерь, длина потерь и т.п.

Перемешивание пакетов – параметр, характеризующий процесс изменения первоначального порядка следования пакетов. Например, если из первого узла вышел поток пакетов в следующем порядке: 1, 2, 3, 4, 5, 6, 7, 8, 9, а вторым узлом он был принят в таком виде: 1, 2, 4, 5, 6, 7, 3, 8, 9, то говорят, что произошла пакетная перестановка. Эта характеристика важна для работы протоколов реального времени.

Скорость передачи данных – скоростная характеристика способности канала передавать крупные массивы данных. Под словом "крупные" имеется в виду объём данных много больше размера пакета. Причём данными считаются только непосредственно передаваемая, полезная информация, исключая всевозможные протокольные заголовки и прочую служебную информацию. Скорость передачи данных - R можно определить так: R = S / , где S – количество переданной информации (размер пакета), – время, затраченное на передачу информации, измеряется в битах в секунду (бит/с).

Пропускная способность в отличие от скорости передачи данных, является характеристикой самого канала передачи данных, как совокупности устройств, предназначенных для передачи данных, без учёта его загрузки и режимов работы. В общем случае она будет определять максимально возможную скорость передачи данных, и ограничивать её сверху. Её можно определить по-разному, в зависимости от условий её применения. Пропускная способность – это не интегральная величина, как скорость передачи данных, но на каждом участке канала она своя, и для каждого участка определяется отдельно. В связи с этим, когда говорят о пропускной способности канала, чаще всего имеют в виду пропускную способность самого "узкого" места в канале.

Пропускная способность C - равна: C = S / , где S – размер пакета, – время, затраченное на передачу пакета из источника в канал, либо из промежуточного маршрутизатора в канал. При этом S может быть, как величиной полезной информации, так и полной передаваемой информацией, включая служебную информацию. Под , можно подразумевать чистое время передачи пакета, либо время передачи вместе с техническими паузами.

Если пропускная способность определяется для расчета максимально возможной скорости передачи данных, то её корректнее определить как: C(S) = S f(S), где S – полезная информация, содержащаяся в одном пакете, а f(S) – это максимально возможная частота передачи пакетов (пакет/с), несущих S полезной информации.

 

2. Модели пакетного зондирования.

        Для диагностики каналов передачи данных пакетными методами сначала использовали наиболее простую модель описания процесса прохождения пакета по заданному пути – одно-пакетную модель [2]. Рассмотрим, например, канал, состоящий из l линий связи, соединённых между собой маршрутизаторами (М) с находящимися на обоих концах рабочими станциями (Р) (рис. 1).


Рис. 1.   Модель канала передачи данных глобальной сети.

 

        Будем пропускать через канал пакеты разного размера, таким образом, чтобы от любого маршрутизатора мы могли получать маленькие пакеты - отклики определённого размера. Тогда время t1 с момента передачи до момента приёма отклика от 1-го маршрутизатора будет равно:

,(1)

где tcreate 1 – время создания и выдачи пакета из памяти в сетевой интерфейс, S – размер пакета, b1 – пропускная способность интерфейса, l – длина линии связи, c – скорость света, tcomp 1 – время обработки пакета приёмной станцией, tback 1 – время прохождения отклика обратно.

        Из (1) видно, что от размера пакета зависит только время передачи пакета из интерфейса в среду передачи – S / b1. В дальнейшем всё, что не зависит от S, обозначим: . Будем полагать, что на обоих концах линии находятся одинаковые интерфейсы. Пример использования этой модели приведен на рис. 2. В одно-пакетной модели, предполагается, что время передачи линейно по отношению к размеру пакета, все линии одноканальные (то есть пакеты не могут идти параллельно), и что существующий уже поток данных не будет заставлять посланные пакеты простаивать в очереди.

 


Рис. 2.   Диаграмма прохождения пакета по каналу.

       

        Первое предположение почти всегда верно, второе – в большинстве случаев, но вот третье предположение всегда не верно (ведь мы не единственные, кто пользуется сетью). Но, несмотря на это, есть способ, позволяющий обойти это препятствие. Дело в том, что добавочный поток данных может только увеличить время прохождения пакета, следовательно, если мы проведём достаточно большую серию измерений, то сможем найти минимальное время, соответствующее тому, когда нашему пакету никто не мешал.

 


Рис. 3.   Зависимость времени обхода канала TR от величины размера пакета.

 

        Изначальный набор данных приведен на рис. 3, где изображена зависимость времени обхода канала - TR , измеряемая в мс, от размера пакета (для каждого размера пакета проводится серия измерений) в байтах. В дальнейшем будем считать, что минимальные времена соответствуют проходу пакета без задержек в очереди.

        Из формулы (1) легко видеть, что для линии 0–1 пропускная способность будет равна . Обобщив метод на произвольное число линий - n, получим:

(2)

(3)

Формула (3) – это итерационное соотношение, b1,...,bn-1 мы находим тем же самым способом.

        Таким образом, измеряя последовательно все n линий, мы можем получить пропускную способность каждой отдельно взятой линии.

Метод пакетной пары [3] – предназначен для определения номинальной пропускной способности канала, то есть максимально возможной пропускной способности незагруженного канала. Он основан на использовании пакетной пары – двух пакетов, выпущенных в канал непосредственно друг за другом. Отправленные таким образом пакеты, могут быть приняты с временным интервалом - = S / C , где S – размер пакета, C – номинальная пропускная способность интерфейса, через который пакеты попали в канал. Рассмотрим иллюстрацию работы этого метода на рис. 4. Видно, что на выходе канала, состоящего из нескольких линий, интервал пакетной пары будет соответствовать самому узкому месту в канале.

 


Рис. 4.   Прохождение пакетной пары по каналу. Ширина каждой линии связи соответствует её пропускной способности.

 

        При наличии загрузки канала другими потоками данных, пакеты, распространяющиеся в канале, начинают взаимодействовать, а точнее перемешиваться с нашей пакетной парой. Какой-нибудь побочный пакет может войти между пакетами нашей пары, и тогда интервал времени увеличится. Либо, если непосредственно перед пакетной парой промежуточный маршрутизатор примет большой побочный пакет, то интервал времени пакетной пары может уменьшиться, так как первый пакет пары не сможет отправиться, а будет стоять в очереди, ожидая передачи побочного пакета, и таким образом, дождётся окончания приёма второго пакета.

На рис. 5-7 приведены данные, полученные на канале, сформированном эмулятором сети [4]. Эмулятор сети - программа, моделирующая компьютерную сеть на всех уровнях её работы - от канального, до приложений. Она позволяет изменять характеристики узлов и элементов в широких пределах.

        Канал состоял из участков с пропускной способностью 100, 75, 55, 40, 60, 80 Мбит/с соответственно. Размер пакетов был равен 1500 байт. Моделировалась загрузка канала побочными потоками пакетов с размером 1500 байт. Уровень загрузки канала обозначим - u.

 


Рис. 5.   Канал с загрузкой 20% [3].

 

        На рис. 5 мы видим, что при u = 20%, подавляющее большинство интервалов пакетных пар находятся в области 1. Область 1 соответствует тем интервалам, используя которые в расчёте пропускной способности, мы получили бы пропускную способность самого узкого участка канала. Что и видно на рис. 5, и это соответствует пропускной способности канала – 40 Мбит/с. Одновременно наблюдаются области 2 и 3, соответствующие интервалам времён, получаемым в результате увеличения и уменьшения, соответственно, интервала пакетов, под действием дополнительного трафика в канале, причём при увеличении загрузки до u = 80% области 2 возрастают (рис. 6).

 


Рис. 6.   Канал с загрузкой 80% [3].

 

        Область 3 соответствует пропускной способности следующего за узким местом участка канала – 60 Мбит/с, так как произвольно уменьшенный интервал, вновь стал соответствовать пропускной способности самого узкого из всех последующих участков канала, то есть 60 Мбит/c.

 


Рис. 7.   Канал с загрузкой 50% [3].

 

        На рис. 7 видно, что можно наблюдать интервалы соответствующие 80 Мбит/c участку канала, при этом при загрузке канала u = 50%, области 3 заметно возрастают.

Модель пакетной цепочки. Усовершенствуя модель пакетной пары, можно посылать большее число (N > 2) пакетов размером S, идущих друг за другом [3]. Эта последовательность пакетов называется пакетной цепочкой длины N. Приёмник пакетов регистрирует интервал (N) пакетной цепочки – интервал времени от первого до последнего пакета. Тогда можно вычислить пропускную способность канала:

(4)

 


Рис. 8.   Измерения канала с загрузкой u = 80% пакетной цепочкой [3].

 

        Без побочного трафика пропускная способность будет соответствовать пропускной способности самого узкого места в канале, также как и в случае пакетной пары. На первый взгляд может показаться, что использование пакетной цепочки приводит к меньшей зависимости от шумов, так как интервал времени возрастает пропорционально N, а шумы остаются прежними. Но это совсем не так, поскольку при возрастании интервала времени возрастает и вероятность того, что пакеты цепочки провзаимодействуют с пакетами побочного потока.

        Рассмотрим результаты измерений пропускной способности при помощи пакетной цепочки на том же канале, что и в предыдущем случае, но при уровне загрузки канала u = 80% (рис. 8а-г). Видно как меняется характер гистограммы интервалов времени пакетных цепочек при увеличении числа пакетов цепочки.

        По оси абсцисс, как и ранее, отложены не сами интервалы, а величины пропускной способности рассчитанные по формуле (4). Видно, что по мере возрастания N, практически полностью подавляются и 1, и 3 области. При этом, среднее значение всех интервалов времени (область 4) перестаёт зависеть от N, и становится равным 15 Мбит/с.

        Представим, что канал состоит из двух сегментов с пропускными способностями C1 и C2 так что C1 > C2, то есть второй сегмент – узкое место (см. рис. 4). Пакетная цепочка посылается из источника с начальным интервалом 1 = S (N - 1) / C1. Пусть r1 – средняя интенсивность побочного трафика. Средняя величина побочного трафика, прибывшего во второй сегмент C2 в течение времени 1 – будет . Тогда при взаимодействии побочного трафика и пакетной цепочки средний интервал времени цепочки станет равным , где u1 = r1 / C2 – загрузка (использование) узкого сегмента.

        Если по измеренному интервалу цепочки вычислить пропускную способность R (она называется асимптотической пропускной способностью), то получим: . Получается меньшее значение, чем реальная пропускная способность сегмента, и видно, что она зависит лишь от физических характеристик C1 и C2, и от загрузки канала побочным трафиком. Если известны пропускные способности сегментов канала и измерена величина R, можно вычислить уровень загрузки сегментов канала.

        Все вышеперечисленные методы были реализованы программно и ниже проведён их краткий обзор.

        В 1980 году была создана программа, позволяющая проводить измерения характеристик каналов – ping [5]. Очень быстро она стала стандартным инструментом диагностики сетей и на сегодня является частью любой операционной системы. Работает ping просто, посылая пакеты-запросы на заданный пользователем удалённый узел сети и принимая, пришедшие обратно, пакеты-отклики. При этом замеряется время, пройденное с момента отправки пакета-запроса до момента приёма пакета-отклика, проводится основная статистическая обработка данных, а именно: вычисляется минимальное, максимальное, среднее время, стандартное отклонение, а также процент потерянных пакетов.

        Значительным продвижением в этой области было создание в 1988 году программы traceroute [5]. Она, помимо измерения времени, прослеживает путь, по которому идут пакеты, и, фактически, измеряет время доступа до каждого промежуточного маршрутизатора, пройденного пакетом на заданном пути, т. е. производит дифференциальные измерения.

        В 1991 году была разработана первая версия программы – pathchar [6]. Она вобрала в себя свойства ping и traceroute, но предоставив при этом новые возможности. Помимо времени доступа, для каждого уровня зондирования (для каждого маршрутизатора) она выдаёт следующие значения: уровень потерь, среднее время обхода канала до указанной точки - TR, среднюю задержку в очередях, среднее время прохода каждого сегмента канала, пропускную способность каждой линии. В итоге выдаётся общая информация: длина канала (число маршрутизаторов), среднее время обхода канала, пропускная способность узкого места, средняя задержка в очередях. На основе pathchar была создана программа – pchar [7,8], однако, принципиальных различий между ними нет.

        Надо заметить, что все вышеизложенные программы работали по принципу одноточечных измерений, то есть для их работы достаточно запустить программу всего на одном узле сети. Они использовали одно-пакетную модель.

        В 2001 году была создана программа – pathrate [3]. Она использует модели пакетных пар и цепочек. Важное отличие состоит в том, что она работает по принципу двухточечных измерений. Ей необходимо два узла, между которыми она проводит свои измерения. Основная характеристика канала, измеряемая pathrate – пропускная способность канала. Но она, как и все предыдущие, не позволяет проводить глубокий анализ полученных временных рядов. Например, не ставилась задача получать различные функции распределения, а так же недостаточен набор параметров, которые можно варьировать при проведении измерений. Поэтому, все получаемые, описанными выше программами, результаты представляют скорее практический, чем научный интерес.

        Следовательно, необходимо создать программный комплекс, который бы вбирал в себя все уже имеющиеся методы измерений, и позволял бы при этом получать богатый набор физических характеристик канала передачи данных.

 

3. Управление зондирующим потоком.

        Для реализации дифференциальных измерений используется задание значений специального поля заголовка IP-пакета – время жизни пакета, обозначим его - TL [5,7]. Этот параметр был введен для ограничения времени "блуждания" пакета по сети. Каждую секунду, а также после каждого прохода через маршрутизатор от параметра времени жизни пакета отнимается единица. Если после очередного уменьшения это значение становится нулевым, то такой пакет дальше не отправляется, а уничтожается, и маршрутизатор по обратному адресу отправляет сообщение об ошибке с помощью Интернет протокола контрольных сообщений - ICMP [5,7]. Таким образом, если мы зададим время жизни наших пакетов равным единице, то они все будут умирать на первом же маршрутизаторе. Если двойке – то на втором, и так далее, а мы будем получать необходимые нам пакеты ICMP сообщений от этих маршрутизаторов, и тем самым знать времена прохода пакетов туда и обратно до каждого маршрутизатора M, как показано на рис. 9.

 


Рис. 9.   Дифференциальные измерения.

 

    Для того чтобы измерения были корректными, необходимо учесть, что методы активной пакетной диагностики, предполагают вмешательство в канал, то есть, поток пакетов, направляемый в канал для проведения измерений, сам может вызвать изменение физических характеристик канала. Например, если поток пакетов слишком интенсивный, то может произойти переполнение буферов маршрутизаторов, и перестанет обеспечиваться заданная пропускная способность.

        Программный комплекс ANNET-МГУ был создан на физическом факультете МГУ и работает на сервере epsilon.phys.msu.ru ИВС физического факультета МГУ под операционной системой FreeBSD [9-12]. Проведенные до этого измерения различных сегментов ИВС физического факультета МГУ указали на необходимость его создания [13-16].

        В ANNET-МГУ используется протокол транспортного уровня пользовательских датаграмм - UDP [5], так как пакеты этого протокола передаются по наиболее простому алгоритму: они не требуют коррекции ошибок и установления соединения, и они могут распространяться независимо друг от друга.

        ANNET-МГУ посылает пакеты разного размера, на различную глубину проникновения в канал, которая задаётся значением параметра времени жизни - TL, кроме того, он обладает способностью перехватывать пакеты-отклики от промежуточных узлов внутри канала, проводя при этом измерения времени между передачей и приёмом пакета. Затем выжидается определённое время, и посылается следующий пакет. Это время выжидания определяет вид временного распределения потока пакетов. Набирая статистику, можно получить статистические временные характеристики канала. Рассмотрим блок-схему программного комплекса ANNET-МГУ (рис. 10) и поясним принцип его работы.

 


Рис. 10.   Блок-схема программного комплекса ANNET-МГУ.

 

        Пакет, представляющий собой массив данных, формируется генератором пакетов, который наполняет пакет содержимым, в нашем случае – случайными числами. Блок задания параметров определяет момент выдачи пакета в передающую среду, в соответствии с необходимыми статистическими и временными параметрами выходного потока пакетов.

        Масштаб времени определяется по системным часам, время выдачи пакета заносится в тестовую таблицу, куда будет помещено и время прихода пакета-отклика. В момент выдачи, пакет отправляется в программный интерфейс сетевой карты. Из сетевой карты сигнал распространяется в среду передачи данных. Отправленный пакет порождает пакеты-отклики, которые возвращаются к пославшей пакет рабочей станции.

        Отклики принимаются сетевой картой и через программный интерфейс считываются виртуальным прибором. Фильтр предназначен для того, чтобы из всего множества пакетов, перехваченных программным интерфейсом, выделить нужные нам отклики от наших зондирующих пакетов. Все характеристики входящего потока пакетов собираются приёмником пакетов. Тестовая таблица, формируемая в результате измерений, обрабатывается анализатором, который выдает все необходимые статистические и временные данные, например, рассчитывает пропускную способность каждого отдельного участка канала, или получает функцию плотности распределения различных величин. Интерпретатор анализирует полученные результаты по различным моделям.

        При проведении измерений варьируются следующие характеристики исходного цифрового сигнала: размер пакета, временной интервал следования пакетов (а в дальнейшем и "распределение" периода следования). По мере развития программы ANNET-МГУ, предполагается изменять протокол передачи, энтропию пакетной последовательности, энтропию содержимого пакета и характер реализации и спектр (временного) содержимого пакета.

        В результате измерений получаются первичные данные: времена возвратов пакетов от конкретных узлов и уровень потерь (числа пакетов). Анализ первичных результатов формирует вторичные данные: обхода и статистические характеристики этих времён, пропускная способность, временная динамика и статистические характеристики времён возврата (уже не , а t) (т.е. можно определять временные Фурье-спектры среды, и временные диаграммы самих устройств канала, корреляцию функции входа и выхода, а также различных участков канала).

        Таким образом, от ANNET-МГУ мы получаем все необходимые нам сведения о процессах происходивших с пакетом при его прохождении транспортной среды передачи данных, что позволяет заметно расширить набор наблюдаемых одновременно физических характеристик канала, по сравнению с описанными ранее программами.

        Программный комплекс ANNET-МГУ был протестирован на корректность измерений, и совпадение результатов с эталонными величинами. Тестирование проводилось на специально созданном канале, внутри локальной сети лаборатории. Тестовый канал состоял из двух рабочих станций, соединённых между собой Ethernet сегментом на витой паре при максимальной пропускной способности 10 Мбит/с. Первая рабочая станция использовалась для запуска ANNET-МГУ, а вторая – служила принимающим узлом, способным возвращать посланные ему пакеты (рис. 11).

 


Рис. 11.   Схема тестовых измерений.

 

        На первой рабочей станции, помимо ANNET-МГУ, запускалась программа ipfw, создающая виртуальный канал, с динамически изменяющимися характеристиками, такими как: время задержки, уровень потерь, размер очереди, пропускная способность и тому подобные. Необходимо было провести сравнение полученных обеими программами результатов.

        Управляющая тестированием программа на первой рабочей станции, задавала режимы работы ANNET-МГУ и ipfw. Все пакеты, порождаемые ANNET-МГУ, пропускались через виртуальный канал, поскольку его параметрами мы можем легко управлять, чего нельзя сказать о стандартном Ethernet канале. Было проверено соответствие между заданными нами характеристиками виртуального канала и результатами измерений, получаемыми ANNET-МГУ. Проводились измерения двух параметров – времени задержки - TR , и уровня потерь пакетов.

        На рабочей станции № 1 управляющая программа проводила последовательные изменения характеристик виртуального канала и в то же время запускала тестовые измерения канала при помощи ANNET-МГУ. Были измерены характеристики виртуального канала при ряде значений его параметров, заданных ipfw, и построены графики соответствия параметров, задаваемых ipfw, и параметров измеренных ANNET-МГУ. На рис.12, приведены графики зависимости уровня потерь и временной задержки для обеих программ. Видно, что получились практически прямые линии обеих зависимостей.


Рис. 12.   Зависимость параметров, регистрируемых ANNET-МГУ, от предустановленных при помощи ipfw.

 

        При величине задержки менее 1 мс, погрешность измерений составляла около 20%, при больших значениях задержки, эта погрешность может быть в несколько раз снижена. Поскольку ANNET-МГУ и ipfw – это совершенно независимые программные инструменты, то совпадение результатов говорит о корректности работы как одной, так и другой.

        Таким образом, установлено, что ANNET-МГУ может служить надёжным средством определения уровня потерь и временных характеристик каналов передачи данных.

        Созданный программный комплекс ANNET-МГУ предназначен для проведения измерений в сетях с произвольной топологией, при условии использования коммутаторов третьего уровня и симметричных каскадов. При этом он позволяет, изменяя размеры пакета, интервал следования и глубину проникновения в канал, получать времена задержки пакетов – TR от каждого промежуточного узла, а также уровень потерь на сегменте.

        После анализа этих времён формируются вторичные данные: статистические характеристики этих времён, пропускная способность, определяться временная динамика и статистические характеристики времён возврата.

        Контроль состояния канала передачи данных представляет собой задачу, решаемую параллельно с функционированием канала, в режиме его реальной работы. По этой причине разработка методов и выбор параметров контроля должны соответствовать критерию невозмущающих измерений [17].

        В отличие от пассивного метода [18] измерения каналов передачи данных, активные методы, связанные с внедрением в канал своих пакетов, нуждаются в исследовании на предмет зависимости результатов измерений от интенсивности зондирующего потока.

        На рис. 13 представлены зависимости среднего значения и дисперсии от интервала следования зондирующих пакетов. Видно, что в пределах стандартного отклонения среднее значение остаётся постоянным, да и сама дисперсия практически не зависит от интенсивности зондирующего потока. Тем самым выполнен критерий невозмущающих измерений, а именно: измерения производимые в системе не влияют на характеристики системы.

        Важным свойством, которое определяет применимость результатов зондирования для описания свойств канала, является стационарность. Полагается, что результаты измерений стационарны, если они повторяемы и не меняются во времени (от измерения к измерению). Для примера рассмотрим те же данные, представленные на рис. 13. Каждая точка этих графиков была получена с интервалом примерно в 1 мин.


Рис. 13.   Зависимость среднего и дисперсии TR от интенсивности зондирующего потока.

 

        Как видно, измерения продолжались около 20-и минут, и на протяжении всего этого времени значения TR оставались с достаточно большой точностью на одном уровне. В сетевых измерениях интервал времени - 20 минут уже можно считать достаточно большим, чтобы говорить о стационарности результатов. В то же время он достаточно мал, чтобы на среднее значение TR не влияли суточные колебания уровня загрузки канала, от которых, несомненно, величина TR должна зависеть, поскольку любые измерения в глобальной сетевой структуре по конкретной выбранной трассе происходят в присутствии других потоков, искажающих собственные характеристики канала.

 

4. Свойства временных рядов одноуровневого пакетного зондирования.

        ANNET-МГУ позволяет получать статистику времён обхода каналаTR, из которой можно построить функции плотности распределения этих времён. Продемонстрируем результаты, полученные на примере трассы epsilon.phys.msu.ru – nt.lib.msu.ru.

        На рис. 14 приведены функции плотности распределения dp / dTR для пакетов размером 100 байт и 1100 байт, для трёх разных измерений: канала состоящего из одного сегмента, затем из двух и из трёх. На рис. 14 (правый рисунок) видно изменение вида функций распределения по сравнению с левым рисунком, если использовать 1100 байтовые пакеты. Функции смещаются в сторону больших времён, из-за того, что требуется большее время для передачи больших пакетов.


Рис. 14.   Функции плотности распределения TR.

 

        Виртуальный прибор ANNET-МГУ позволяет также получить основные физические характеристики этих распределений такие как: среднее значение, дисперсию, коэффициенты асимметрии и эксцесса. Они приведены в табл. 1., где N – число промежуточных сегментов в канале, а мин – минимальное время обхода из статистики, то есть это та точка на оси времени, из которой выходит функция распределения.

 

Таблица 1. Основные характеристики функций распределения TR.

Размер пакетов 100 байт

N мин., с среднее значение, с дисперсия, с2 коэффициент асимметрии коэффициент эксцесса
1 2,89E-04 3,77E-04 3,56E-07 4,11E+01 2,04E+03
2 1,10E-03 1,50E-03 3,57E-06 2,15E+01 5,24E+02
3 9,70E-04 1,22E-03 1,26E-07 1,19E+01 2,54E+02

Размер пакетов 1100 байт

N мин., с среднее значение, с дисперсия, с2 коэффициент асимметрии коэффициент эксцесса
1 4,60E-04 5,55E-04 4,81E-07 3,62E+01 1,59E+03
2 1,94E-03 2,33E-03 3,16E-06 1,94E+01 4,50E+02
3 1,63E-03 1,85E-03 1,23E-07 1,44E+01 3,55E+02

        Будем сначала рассматривать данный временной ряд как случайный процесс. Как у любого случайного процесса, у него есть некоторые общие характеристики, например: минимальное значение времён, среднее значение, дисперсия и другие. Кроме того, есть ещё общие свойства, например – стационарность. Рассмотрим зависимость этих характеристик от размера зондирующего пакета. Измерения проводились на канале epsilon.phys.msu.ru – gw256.phys.msu.ru.


Рис. 15.   Зависимость минимального и среднего времени TR от размера пакета.

 

        На рис. 15 представлены зависимости минимального и среднего значения времён возврата TR зондирующих пакетов. Видно, что они практически линейны. Это хорошо соотносится с одно-пакетной моделью, где предполагалось, что от размера пакета зависит лишь время выдачи пакета в канал, и эта зависимость линейна и определяется номинальной пропускной способностью передающего интерфейса.

        Значение пропускной способности, полученное из коэффициента наклона графиков на рис. 15, составляет 8997 ± 13 кбит/с, в то время как номинальная пропускная способность канала равняется 10000 кбит/с. Отсюда видно несовершенство метода определения пропускной способности в рамках одно-пакетной модели.

 


Рис. 16.   Зависимость дисперсии TR от размера пакета.

 

        На рис. 16 приведена зависимость дисперсии функции распределения времени от размера пакета. Видно, что фактически эта зависимость отсутствует, вместо этого наблюдается шумовой характер графика, который не повторяется при повторных экспериментах. Из этого следует, что дисперсия не определяется самим потоком, и его взаимодействием с каналом передачи данных. Вместо этого она определяется наличием побочных потоков данных в канале, или, так называемых, шумов в канале. С ними зондирующий поток перемешивается, и это сказывается на задержке пакетов. Ниже будет описано влияние побочных потоков на дисперсию на примере зависимости дисперсии от величины уровня потерь.

 


Рис. 17.   Зависимость коэффициентов асимметрии и эксцесса от размера пакета.

        На рис. 17 показана зависимость коэффициентов асимметрии и эксцесса от размера пакетов. Как и в случае с дисперсией видно отсутствие зависимости.

        Рассмотрим поведение параметров временного ряда при наличии потерь в канале. Надо сразу заметить, что среднее значение, очевидно, будет зависеть от дисперсии, так как минимальное значение времён TR уже фиксировано физическими свойствами канала, и при расплывании функции распределения, её среднее значение будет смещаться в сторону больших времён.


Рис. 18.   Зависимость среднего значения TR от уровня потерь в тестовом канале.

 

        На рис. 18 приведена зависимость среднего значения TR от уровня потерь в тестовом канале, а на рис. 19 – зависимость дисперсии TR от уровня потерь. Как мы видим, обе зависимости, с хорошей степенью точности, линейны.


Рис. 19.   Зависимость дисперсии TR от уровня потерь в тестовом канале.

 

        На рис. 20 представлена зависимость дисперсии TR от уровня потерь в реальном (не тестовом) канале. Здесь мы уже не видим линейной зависимости, вероятно, это связано с тем, что помимо потерь на дисперсию гораздо сильнее влияют побочные потоки пакетов, то есть загрузка канала.


Рис. 20.   Зависимость дисперсии TR от уровня потерь в реальном канале.

 

        Зависимость TR от уровня потерь фактически означает, что рассматриваемая нами система реагирует на собственные потери, возникающие вследствие переполнения буфера, перегрузки маршрутизаторов или по другим причинам. При этом система вносит дополнительные задержки. Механизм этой зависимости до конца не ясен, и является предметом дальнейших исследований.

        С точки зрения физики, этот результат достаточно интересен. Известно соотношение Крамерса-Кронинга, устанавливающее связь между дисперсией и потерями в электромагнитной волне, проходящей через конкретную систему. Это соотношение говорит о том, что никакая составляющая волны не может поглотиться системой без того, чтобы остальные составляющие при этом не получили фазовый сдвиг. То есть, существует сходство в характере поведения радиофизических и телекоммуникационных систем.

        Таким образом, был разработан и создан виртуальный прибор ANNET-МГУ, который может служить инструментом получения статистических данных о канале передачи данных. Он предназначен для проведения измерений в телекоммуникационных сетях с произвольной топологией, при условии использования коммутаторов третьего уровня и симметричных каскадов. ANNET-МГУ может стать базовым при создании универсального измерительного комплекса сетевых исследований.

        Доказано, что измерения при помощи программного комплекса ANNET-МГУ являются невозмущающими и стационарными, что следует из характера зависимостей среднего и дисперсии TR от интенсивности потока.

        Установлено, что пакетным методом, собирается информация, которая при соответствующей обработке позволяет провести исследования основных физических характеристик канала передачи данных, таких как: распределения плотности вероятностей времён обхода канала, минимальное, среднее, дисперсию, асимметрию и эксцесс для этих времён, и соответственно пропускную способность канала и всех его сегментов в отдельности. Анализ полученных результатов измерений показал, что данные экспериментов стационарны и повторяемы.

 

5. Литература.

  1. IP Performance Metrics (ippm), http://www.ietf.org/html.charters/ippm-charter.html
  2. Kevin Lai and Mary Baker. Measuring Link Bandwidths Using a Deterministic Model of Packet Delay. Stanford University, 2000.
  3. Dovrolis Constantinos, Ramanathan Paramenswaran, Moore David. What do packet dispersion techniques measure? In Proceedings of the 2001 Infocom, Anchorage AK, April 2001.
  4. Network Simulator, version 2, http://www-mash.cs.berkeley.edu/ns/
  5. Фейт С. TCP/IP Архитектура, протоколы, реализация. Издательство "Лори", 2000.
  6. Jacobson Van. Pathchar - a tool to infer characteristics of Internet paths. Presented at the Mathematical Sciences Research Institute, ftp://ftp.ee.lbl.gov/pathchar/msri-talk.pdf, 1997
  7. Mah B. Pchar: Child of Pathchar. Presented at the DOE NGI Testbed Workshop, Berkeley, CA, 21 July 1999. http://www.employees.org/~bmah/Talks/pchar-NGI-99-Slides.pdf
  8. Mah B. Estimating Bandwidth and Other Network Properties. Presented at the Internet Statistics and Metrics Analysis Workshop on Routing and Topology Data Sets: Correlation and Visualization, San Diego, CA, 7-8 December 2000. http://www.employees.org/~bmah/Talks/pchar-ISMA.pdf
  9. Трухин В.И., Сандалов А.Н., Щербаков А.Е., Саламатов А.С., Стрельников В.Ю. Информационно-вычислительная сеть физического факультета МГУ. Препринт физического факультета МГУ, № 7/1995, 16 с.
  10. Садовничий В.А., Васенин В.А., Бережнев С.Ф., Сандалов А.Н., Смелянский Р.Л. Информационно - вычислительная сеть Московского университета.// В книге: Компьютерные технологии в высшем образовании. т. 1., М.: Изд-во Моск. ун-та. (Программа "Университеты России”), 1994, стр. 33-50.
  11. Трухин В.И., Сандалов А.Н., Сухарева Н.А. Телекоммуникационное сопровождение физического образования, Физическое образование в вузах, 1998, т. 4, № 2, стр. 64-78.
  12. Садовничий В.А., Трухин В.И., Васенин В.А., Сандалов А.Н., Сухарева Н.А. Учебно-образовательная сеть Московского университета. "Физическое образование в вузах", 1999, т. 5, № 2, стр. 5-22.
  13. Басистов А.В, Максимов Ю.В., Сандалов А.Н, Сухарева Н.А. Методы активной пакетной диагностики глобальных телекоммуникационных каналов. Сборник расширенных тезисов докладов научной конференции "Ломоносовские чтения. Секция физики", апрель 2001, М:., МГУ, физический факультет стр. 119-122.
  14. Басистов А.В., Сухарева Н.А. Дифференциальный мониторинг пропускной способности каналов передачи данных. Труды VIII Всероссийской школы-семинара "Физика и применение микроволн", 26-30 мая 2001, Звенигород, Московская область, часть 2, стр. 134-135.
  15. Афанасьев И.А., Басистов А.В., Максимов Ю.В., Сандалов А.Н., Сухарева Н.А., Фокин В.А. Метрики телекоммуникационных каналов передачи данных, Труды всероссийской научной конференции "Научный сервис в Интернет 2002", стр. 167-169.
  16. Sandalov A.N., Soukhareva N.A., Afanas'ev I.A., Basistov A.V., Maksimov Yu.V. Datachannel metrics: structure, measuring and predictions. 16 – DFN –Arbeitstagung uber Kommunikationsnetze in Duesseldorf , 22-24 mai 2002.
  17. Gershenfeld N. The Physics of Information Technology. Cambridge University Press, 2000, 370 pp.
  18. Cleary J.G. and Martin H.S. Estimating Bandwidth from Passive Measurement Traces. Proceedings of the PAM2001 workshop on Passive and Active Measurements. Amsterdam, April, 23-24th, 2001.

 

оглавление

дискуссия