О ПРОБЛЕМЕ РАЗРАБОТКИ СИСТЕМЫ ОБРАБОТКИ РЕЧИ В РЕЖИМЕ РЕАЛЬНОГО ВРЕМЕНИ

Описаны методы разработки системы распознавания речи, ее перевода на иностранный язык, а также синтеза речи. Рассмотрены следующие методы проектирования: создание моделей существующих решений и построение на этой основе модели будущего решения (IDEF0 модели AS-IS и TO-BE), построение диаграммы потоков данных (DFD-модель), построение модели сущность-связь (ERD-модель). При описании проблемы разработки системы решался ряд нетривиальных проблем: считывание речи, ее анализ, перевод на иностранный язык, симуляция голоса говорящего. В качестве дополнительного программного обеспечения предлагается использовать интерфейс прикладного программирования “Google Translate API”, который обеспечивает реализацию считывания речи и ее перевода на иностранный язык. Для реализации анализа речи применяются методы, которые используются в клонировании голоса: спектральный анализ речевого сигнала на базе быстрого преобразования Фурье (FFT-анализ), математический аппарат динамического программирования (ДП-метод), алгоритм разметки питчей речевого сигнала.

Ключевые слова

Проблема международной коммуникации, система обработки речи, автоматическая обработка речи, распознавание речи, анализ голоса, перевод речи, синтез речи, клонирование голоса, клонирование речи.

Номер: 2
Год: 2017
ISBN:
UDK: 004.934
DOI:
Авторы: Тарасов А. А., Костин В. Н.

Информация об авторах: Тарасов Александр Александрович – студент, e-mail: tarasov258@gmail.com, Костин Виталий Николаевич – кандидат технических наук, доцент, e-mail: iitem1@yandex.ru, НИТУ «МИСиС».

Библиографический список:
1. Казанчева A. Ф. Актуальность проблем межкультурной коммуникации в современном поликультурном пространстве. – Пятигорск: ПГЛУ, 2012. – 1 с.
2. Владение иностранными языками [Электр. ресурс] // Владение иностранными языками / ФОМ. – режим доступа: http://fom.ru/Nauka-i-obrazovanie/10998 (дата обращения: 13.11.2015).
3. Mehrabian, Albert; Ferris, Susan R. Inference of Attitudes from Nonverbal Communication in Two Channels. Journal of Consulting Psychology, 1967, 31 (3): 248–252.doi:10.1037/h0024648.
4. Автоматическая сегментация и маркировка речевого сигнала [Электр. ресурс] // БЛОГ Web Программиста. – режим доступа: http://juice-health.ru/archive/38-kompyuternyj-sintez-i-klonirovanie-rechi/184-avtomaticheskaya-segmentatsiya (дата обращения: 25.03.2016).
5. БПФ (Быстрое преобразование Фурье) [Электр. ресурс] // Конт-
рольно-измерительные приборы и системы. – режим доступа http://www.kipis.ru/info/index.php?ELEMENT_ID=40417 (дата обращения: 27.03.2016).
6. Спектроанализатор – мы на нем видим? [Электр. ресурс] // ProSound.iXBT.com. – режим доступа: http://prosound.ixbt.com/edu-
cation/spektr-analys.shtml (дата обращения: 27.03.2016).
7. Частота дискретизации [Электр. ресурс] // Статья из Википедии – Свободной энциклопедии. – режим доступа https://ru.wikipedia.org/wiki/%D0%A7%D0%B0%D1%81%D1%82%D0%BE%D1%82%D0%B0_%D0%B4%D0%B8%D1%81%D0%BA%D1%80%D0%B5%D1%82%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D0%B8 (дата обращения: 27.03.2016).
8. Лобанов Б. М., Киселев В. В. Автоматизация клонирования персонального голоса и дикции для систем синтеза речи по тексту // Международная конференция Диалог-2003. Сборник научных трудов. – М., 2003. – С. 417–424.
9. Окно (весовая функция) [Электр. ресурс] // Статья из Википедии – Свободной энциклопедии. – режим доступа: https://ru.wikipedia.org/wiki/%D0%9E%D0%BA%D0%BD%D0%BE_(%D0%B2%D0%B5%D1%81%D0%BE%D0%B2%D0%B0%D1%8F_%D1%84%D1%83%D0%BD%D0%BA%D1%86%D0%B8%D1%8F) (дата обращения: 03.04.2016).

Наши партнеры

Подписка на рассылку

Раз в месяц Вы будете получать информацию о новом номере журнала, новых книгах издательства, а также о конференциях, форумах и других профессиональных мероприятиях.