Давайте рассмотрим задачу сжатия речи.
Что есть человеческая речь? Определений много. За ними могу отправить читателя к специализированной литературе или в Сеть. Нас интересует коммуникативная и физическая сторона процесса и, отчасти, биологическая.
Для дальнейшей работы нам понадобятся следующие знания:
•Речь произносится человеком, диктором,
•Акустический речевой сигнал (колебания воздуха, звуковая волна) переводится в электрический с помощью микрофона,
•Электрический сигнал переводится в цифровую форму и
•Сохраняется в хранилище данных (абсолютно любом) либо
•Передается на расстояние по каналу связи,
•Затем, в какой-то момент, цифровой сигнал снова преобразуется в аналоговый электрический,
•А тот, в свою очередь преобразуется обратно в акустический и
•Доходит до уха другого человека, слушателя.
В нашем случае важно, что акустический сигнал это именно человеческая речь, а не любой другой звук, к примеру, музыка или шум самолетного двигателя.
Также важно, что в канале связи или хранилище мы имеем дело именно с оцифрованным звуком, и для обработки его будем использовать цифровые методы и, возможно, устройства.
Таким образом, задача сужается до сжатия РЕЧИ при передаче по ЦИФРОВЫМ каналам связи либо хранении в ЦИФРОВОМ виде.
Для большей ясности поясню вышесказанное рисунком.