Содержание
- 2. Введение Виды аппаратной и программной реализации систем цифровой обработки речевой и звуковой информации определяются их исходными
- 3. В цифровой телефонии отсчеты аналоговой речи приходится брать согласно теореме Котельникова с частотой 8 кГц Разрядность
- 4. Используемые для звука частоты дискретизации – 32, 44,1, 48, 96 кГц; при этом цифровой поток продискретизированного
- 5. Используемые для звука частоты дискретизации – 32, 44,1, 48, 96 кГц; при этом цифровой поток продискретизированного
- 6. Основные характеристики звуковой информации Аналоговое представление звуковых сигналов основано на подобии форм и основных характеристик соответствующих
- 7. Основные характеристики звуковой информации интерференция – усиление колебаний звука в одних точках пространства и ослабление колебаний
- 8. Сигналограммы фрагментов музыкальной записи и речи
- 9. Уровень электрического эквивалента звукового сигнала обычно характеризуют напряжением, формируемым на выходе квазипикового детектора с малой величиной
- 10. Интенсивность звука или звуковое давление Интенсивность звука или звуковое давление оценивают либо в Паскалях, либо в
- 11. Уровни звукового давления, характерные для различных источников
- 12. Принцип преобразования акустической энергии в электрическую, обработки электрического эквивалента и его последующего преобразования вновь в акустическую
- 13. Уровни электрического эквивалента звуковой системы (N, дБ) пропорциональны уровням звукового давления (SPL, дБ) При уровне SPL=120
- 14. Требования к динамическому диапазону звуковой системы зависят от ее назначения и области использования Динамический диапазон системы
- 15. Речевой сигнал можно рассматривать как последовательность импульсов, разделенных паузами, при которых уровень сигнала ниже некоторого минимального
- 16. Спектральные характеристики звуковых сигналов Реальные звуковые сигналы практически невозможно описать какой-либо математической функцией или эмпирической зависимостью.
- 17. Для расчета частотного спектра ограниченного по длительности сигнала и представленного его дискретными значениями используют дискретное преобразование
- 18. Специфической особенностью восприятия звука является разделение его спектра на полосы равной разборчивости (критические полосы), когда сигнал
- 19. В частотном промежутке от 0 до 16 кГц опытным путем определены 24 полосы, оцениваемые в Барках
- 20. Ширина критической полосы остается примерно постоянной (около 100 Гц) вплоть до значения центральной частоты полосы 500
- 21. Одной из наиболее важных характеристик восприятия звука является громкость, которая характеризует интенсивность звукового события Громкость есть
- 22. Кривые равной громкости (изофоны) были получены учеными Флетчером и Мэнсоном в результате обработки данных большого числа
- 23. Уровень громкости может измеряться также в сонах Преимущество оценки уровней в сонах состоит в том, что
- 24. Разновидности шумов и их спектры В профессиональной литературе рассматриваются несколько различных по спектру разновидностей шумов Белый
- 25. Частотное (одновременное) маскирование С механизмом критических полос слуха человека связаны свойства межполосового и внутри полосового частотного
- 26. Частотное (одновременное) маскирование Эффект маскирования упрощенно можно объяснить тем, что сильный тональный или шумовой маскер создает
- 27. Временное (неодновременное) маскирование Эффект частотной маскировки справедлив для частотных составляющих, присутствующих в спектре сигнала в одно
- 28. Огибающая и мгновенная частота звуковых сигналов По форме огибающей и изменению мгновенной частоты звуковых сигналов производится
- 29. Форма преобразованного по Гильберту сигнала и его спектра в данном случае определяются следующими соотношениями: Огибающая и
- 30. Приведенные преобразования сигналов и их спектров можно использовать для расчетов огибающей и мгновенной частоты звукового сигнала
- 31. В качестве примера приведена диаграмма обозначенного синим цветом сигнала, состоящего из пяти косинусоидальных колебаний различных частот
- 32. Пространственное восприятие звуковых сигналов Локационные способности восприятия звука, так называемый бинауральный эффект, объясняются фазовым смещением звуковых
- 33. На рис. поясняется эффект интегральной локализации восприятия информации от двух источников звука Два одинаковых источника (1
- 34. При задержках одного из сигналов на время более 50 мс наличие запаздывающего сигнала ощущается как помеха
- 35. Для качественного восприятия реального пространственного звучания музыкальных программ использование двухканальной (стереофонической) системы воспроизведения звуковых сигналов не
- 36. Основные принципы цифровых преобразований звуковых сигналов Преобразование аналогового звукового сигнала путем временной дискретизации и квантования выбранных
- 37. Принято, что в звуковой аппаратуре максимально допустимый уровень сигнала соответствует 0 дБ. В связи с этим
- 39. Для оцифровки речевой информации, ограниченной по спектру до 2-5 кГц, обычно используют 7- или 8-разрядные АЦП
- 40. В таблице приведены параметры цифрового потока импульсно-кодовой модуляции (ИКМ) монофонического сигнала. При преобразовании стереофонического или квадрофонического
- 41. Применение рассмотренных методов преобразования шумов квантования не всегда рационально, особенно в случаях необходимости дальнейшей обработки аудиосигналов
- 42. Аналого-цифровое и цифро-аналоговое преобразование звуковых сигналов Кодирующее и декодирующее устройства на входе и выходе оперируют с
- 43. Импульсно-кодовая модуляция (ИКМ) ИКМ – наиболее простой способ преобразования сигналов, обычно содержащий в кодере многоразрядный АЦП
- 44. Sinc-предкоррекция Форма частотной характеристики предкорректирующей цепи определяется формулой: где - постоянная Каталана Ряд достаточно быстро сходится,
- 45. Алиасинг Пусть звук не содержит частот выше 20 кГц. Тогда, по теореме Котельникова, можно выбрать частоту
- 46. Проведем дискретизацию с частотой 40 кГц, а затем – восстановим аналоговый сигнал sinc-интерполяцией Помеха отразилась от
- 47. Как избежать алиасинга? Применить перед оцифровкой анти-алиасинговый фильтр. Он подавит все помехи выше половины частоты дискретизации
- 48. Дифференциальная импульсно-кодовая модуляция (ДИКМ) На вход квантователя последовательно подаются отсчеты не исходного сигнала, а разность между
- 49. Наиболее простым способом кодирования с предсказанием является дельта-модуляция (ДМ), реализуемая с помощью однобитного квантователя. Ошибка предсказания
- 51. Более эффективно использование адаптивной дельта-модуляции (АДМ), при которой в зависимости от характера поступающих на вход кодирующего
- 53. Еще большая эффективность кодирования аудиоинформации может быть получена при квантователе, использующем предсказание более высокого порядка и
- 54. Сигма-дельта модуляция (СДМ) Основой сигма-дельта модуляции является не анализ приращений сигнала, а кодирование уровней самого преобразуемого
- 55. Кодер содержит однобитовый квантователь, на выходе которого формируется сигнал: где v2(n) – дискретные отсчеты сигнала на
- 58. Преимущества СДМ: Простая техническая реализация (по сравнению с ИКМ с линейным многобитным квантователем) Вследствие применения более
- 59. Принципы кодирования речевой и звуковой информации Оцифрованный аудиосигнал в форме одной из вариаций ИКМ является практически
- 60. Частота дискретизации Частота дискретизации (или частота сэмплирования) - частота, с которой происходит оцифровка, хранение, обработка или
- 61. Разрядность Разрядность – это количество бит цифровой информации для кодирования каждого сэмпла. Проще говоря, разрядность определяет
- 62. Битрейт
- 63. Типы битрейта MP3 CBR (Constant Bit Rate) - постоянный битрейт, который задаётся пользователем и не изменяется
- 64. Частота дискретизации, разрядность и битрейты в реальной жизни. Аудио CD-диски, одни из первых наиболее популярных изобретений
- 65. Принципы кодирования речевой информации В качестве международного стандарта для передачи речи принято использование полосы частот от
- 66. Дальнейшим усовершенствованием системы кодирования речи является применение адаптивной дифференциальной импульсно-кодовой модуляции (АДИКМ). Преобразование и передача лишь
- 67. При передаче речи в цифровой форме каждый тип сигнала при одной и той же длительности и
- 68. В интервалы, когда в речи активного участника беседы наступает период молчания, терминалы слушающих могут просто отключить
- 69. Оценки интерпретируют следующим образом: 4-5 - высокое качество; аналогично качеству передачи речи в относительно широкополосных каналах
- 70. Методы кодирования речи
- 71. Математическая модель LPC Множество современных звуковых кодеков основано на кодировании с линейным предсказанием (LPC, linear predictive
- 72. Математическая модель LPC Фильтр LPC определяется формулой: что эквивалентно следующей связи входа и выхода фильтра: Модель
- 73. LPC анализ Рассмотрим один кадр голосового сигнала: S = (s(0), s(1), …, s(159)) Сигнал s(n) связан
- 74. LPC анализ Полученную систему уравнений можно решить следующими способами: - метод Гаусса - любой метод инвертирования
- 75. LPC анализ
- 76. LSP Коэффициенты LPC представляются через линейные спектральные пары LSP (line spectrum pair) LSP математически эквивалентны коэффициентам
- 77. Вокодер LPC 2,4 кбит/сек Блок-схема вокодера: Размер кадра – 20 мсек, то есть 50 кадров в
- 78. 34 бита LSP распределены в соответствии с таблицей: Для усиления G используется 7-битный неоднородный скалярный квантователь
- 79. Кодер CELP 4,8 кбит/сек CELP – Code-Exited Linear Prediction – линейное предсказание с кодовым возбуждением Принципы
- 80. Кодер CELP 4,8 кбит/сек Фильтр предсказания основного тона: Фильтр перцептуального взвешивания: Каждый кадр разделен на 4
- 81. Международные стандарты компрессии речи
- 82. Международные стандарты компрессии речи
- 83. Принципы кодирования звуковой информации Другие задачи возникают при кодировании широкополосных звуковых сигналов, реализующих технологии для музыкального
- 84. Органы слуха человека способны воспринимать информацию в объеме не более 100 бит/с и, следовательно, можно говорить
- 85. Звуковые кодеры MPEG-1, MPEG-2 Layer I, II, III MPEG-4 AAC MPEG-4 HE-AAC Dolby AC3 3GPP AMR-WB+
- 86. Психоакустическая модель №1 (MPEG-1, MPEG-2 Layer I, II) Расчет энергетического спектра выборки звукового сигнала и его
- 87. Психоакустическая модель №2 (MPEG-1, MPEG-2 Layer III) Расчет спектра выборки звукового сигнала Вычисление предсказанных значений амплитуды
- 88. Психоакустическая модель №3 (Dolby AC-3) Расчет МДКП для выборки звукового сигнала и формирование полос психоакустического анализа
- 89. Перцептуальное кодирование звуковых сигналов Общая схема перцептуального аудиокодера: Размер кадра обычно от 2 до 50 мсек
- 90. Перцептуальное кодирование звуковых сигналов В зависимости от целей и дизайна системы кодирования раздел частотно-временного анализа может
- 91. Перцептуальное кодирование звуковых сигналов Квантованные значения параметров кодируются статистическими энтропийными кодерами Так как модель управления психоакустическими
- 92. Pulse-Code Modulation (PCM) PCM – кодек, который используется компьютерами, CD-дисками, цифровыми телефонами и иногда SACD-дисками. Источник
- 93. Waveform Audio File Format (WAVE, WAV) Для того, чтобы записать звук, нам необходимо преобразовать его в
- 94. FLAC (Free Lossless Audio Codec — свободный аудио-кодек без потерь) Принцип кодирования: алгоритм пытается описать сигнал
- 95. Сжатие с потерями (MP3, AAC, WMA, OGG) Используется алгоритм сжатия с потерями, размер MP3-файла со средним
- 96. Почему 44100? Частота 44.1 кГц возникла в конце 1970-х, благодаря PCM адаптерам, которые записывали звук на
- 97. Кроме того, сигнал перед семплированием должен пройти через НЧ фильтр (иначе возникнет алиасинг) и, в то
- 99. Скачать презентацию