previous content next

Введение

Основным подходом к проблеме распознавания речи в настоящее время является ИМЗ-подход. Он базируется на иерархическом (И) принципе обработки информации и на использовании многозначных решений (МЗ) на всех уровнях этой обработки. Опыт исследований показывает, что для достижения приемлемой для практики надежности распознавания речи требуется решение проблемных задач на всех уровнях. А это требует больших затрат и времени. Поэтому выдвигается ряд промежуточных, но важных для практики задач:

  1. распознавание отдельно произносимых слов;
  2. выделение ключевых слов в потоке речи;
  3. распознавание слитной речи, составленной из слов заданного словаря.

Оказалось, однако, что и решение перечисленных задач для произвольного диктора или неограниченного словаря требует серьезных усилий и остается еще целый ряд принципиальных вопросов, требующих глубокой проработки.

В данной работе ставится несколько иная задача. Отличительной особенностью этой задачи является то, что заранее известно, какую фразу должен произнести человек. Требуется распознать лишь то, что он ее действительно правильно произнес. То есть задача состоит в сравнении поступающего нового произнесения фразы с эталонным произнесением для проверки того, что это произнесения одной и той же фразы. Качество распознавания можно оценить по контрольным произнесениям фраз, про которые уже ясно, правильные ли они или ошибочные. Задача находит применение в системе обучения немецкому языку.


previous content next