МЕТОД ВЫЯВЛЕНИЯ СИНТЕТИЧЕСКОЙ РЕЧИ В ЦИФРОВЫХ АУДИОЗАПИСЯХ С ИСПОЛЬЗОВАНИЕМ ПРИЗНАКОВ РЕЧЕВОЙ АКУСТИКИ
##plugins.themes.bootstrap3.article.main##
Аннотация
В статье предложен метод обнаружения синтетических аудиозаписей, синтезированных методами машинного обучения, основанный на комбинации методов анализа аудиосигналов с использованием машинного обучения. Подход включает много диапазонное разделение сигнала, извлечение специализированных признаков (MFCC, вейвлеты, фазовые различия, высота тона и др.) и их последующую обработку с использованием гибридной модели нейронной сети. Предлагаемый метод сочетает спектральный анализ, временной анализ, а также фазовые характеристики, что позволяет с большей точностью выявлять артефакты, присущие синтетическим записям. Эксперименты демонстрируют точность 99.8% с EER ~0.0025 и устойчивость метода к современным технологиям синтеза речи, включая диффузионные модели, а также его способность адаптироваться к неизвестным подделкам за счёт комплексного использования разнообразных признаков и их взаимодополняющего характера.