МЕТОД ВЫЯВЛЕНИЯ СИНТЕТИЧЕСКОЙ РЕЧИ В ЦИФРОВЫХ АУДИОЗАПИСЯХ С ИСПОЛЬЗОВАНИЕМ ПРИЗНАКОВ РЕЧЕВОЙ АКУСТИКИ

##plugins.themes.bootstrap3.article.main##

Виталий Роговой
Виктория Михайловна Коржук
Дмитрий Сергеевич Александров

Аннотация

В статье предложен метод обнаружения синтетических аудиозаписей, синтезированных методами машинного обучения, основанный на комбинации методов анализа аудиосигналов с использованием машинного обучения. Подход включает много диапазонное разделение сигнала, извлечение специализированных признаков (MFCC, вейвлеты, фазовые различия, высота тона и др.) и их последующую обработку с использованием гибридной модели нейронной сети. Предлагаемый метод сочетает спектральный анализ, временной анализ, а также фазовые характеристики, что позволяет с большей точностью выявлять артефакты, присущие синтетическим записям. Эксперименты демонстрируют точность 99.8% с EER ~0.0025 и устойчивость метода к современным технологиям синтеза речи, включая диффузионные модели, а также его способность адаптироваться к неизвестным подделкам за счёт комплексного использования разнообразных признаков и их взаимодополняющего характера.

##plugins.themes.bootstrap3.article.details##

Раздел
Системный анализ, управление и обработка информации
Биографии авторов

Виталий Роговой

Аспирант факультета Безопасности Информационных Технологий, Университет ИТМО. 197101, г. Санкт-Петербург, Кронверкский проспект, д. 49, литер А.

Виктория Михайловна Коржук

Кандидат технических наук, доцент факультета Безопасности Информационных Технологий, Университет ИТМО. 197101, г. Санкт-Петербург, Кронверкский проспект, д. 49, литер А.

Дмитрий Сергеевич Александров

Магистр факультета Безопасности Информационных Технологий, Университет ИТМО. 197101, г. Санкт-Петербург, Кронверкский проспект, д. 49, литер А.