Злоумышленники все чаще прибегают к использованию нейросетевых технологий для создания поддельных голосовых записей, имитирующих тембр и интонацию знакомого жертве собеседника, сообщил RT преподаватель кафедры инструментального и прикладного программного обеспечения РТУ МИРЭА Андрей Рыбников.
По его словам, искусственный интеллект все же не безупречен и делает ошибки, выраженные в виде пауз и некорректных ударений.
"Модель не воспроизводит запись, а создает её заново на основе статистических закономерностей, подбирая звуки. Она может точно передать тембр и интонацию, однако не всегда учитывает все нюансы живой речи. Такие ошибки могут проявляться в виде неестественных пауз, смещенных ударений и вариаций интонации", — пояснил он.Рыбников подчеркнул, что распознать такие подделки бывает затруднительно, особенно без визуального сопровождения, когда речь идет о голосовых сообщениях. Он отметил, что подозрения могут вызвать акустические детали:
- неестественные паузы,
- монотонное либо отсутствующее дыхание,
- а также нетипичные фразы.