Рассмотрим процесс речевого диалога в системе Интернет с информационной точки зрения. Этот процесс имеет следующие три фазы:
Во время исполнения первой и третьей фаз передаются только управляющие данные и при этом происходит установление соединения. На протяжении второй фазы абоненты обмениваются как управляющими так и информационными данными.
Источником информационных данных является речевой сигнал, возможной моделью которого является нестационарный случайный процесс. В первом приближении можно выделить следующие типы сигнальных фрагментов: вокализированные, невокализированные, переходные и паузы. При передаче речи в цифровой форме, т.е. в виде последовательности чисел, каждый тип сигнала при одной и той же длительности и одинаковом качестве требует различного числа двоичных единиц (бит) для кодирования и передачи. Следовательно, скорость передачи разных типов сигнала также может быть различной. Отсюда следует важный вывод: передачу речевых данных в каждом направлении дуплексного канала разумно рассматривать как передачу асинхронных логически самостоятельных фрагментов цифровых последовательностей (транзакций) с блочной (дейтаграммной) синхронизацией внутри транзакции, наполненной блоками различной длины.
Описанная модель речевого сигнала является базисной для
изучения (анализа)и построения (синтеза)
IP-телефонных систем. Асинхронность же транзакций позволяет с одной стороны оптимизировать трафик за счет снижения средней скорости передачи и с другой - за счет относительной свободы в воспроизведении каждой транзакции скомпенсировать неидеальности канала передачи. В связи с изложенным обсуждаемая информационная модель речевого сигнала позволяет изменить стандартную постановку задачи конструирования кодека речевого сигнала для систем IP-телефонии. В отличие от традиционных обсуждаемые кодеки целесообразно строить с переменной скоростью. Этот вопрос мы подробнее рассмотрим в разделе, посвященном речевым кодекам.