«Сипуха» разоблачит голосовые дипфейки
Группой сотрудников и студентов кафедры криптологии и кибербезопасности НИЯУ МИФИ под руководством кандидата технических наук, доцента Дмитрия Ефанова разработана интеллектуальная система, способная оценить запись человеческого голоса – не является ли она голосовым дипфейком. Проект стал победителем на Конкурсе Мэра Москвы среди инновационных проектов для лучших предпринимателей, учёных и изобретателей столицы «Новатор Москвы». Разработанный продукт получил название «Сипуха» - в честь ночной птицы, отличающейся особенно острым слухом.
Как рассказал Дмитрий Ефанов, в основе системе лежит нейросеть, обученная различать дипфейки. В качестве данных для обучения нейросети использовалось более 200 тыс. записей человеческих голосов, среди которых были как подлинные записи, так и дипфейки, сгенерированные различными алгоритмами. Выявление дипфейков происходит благодаря анализу так называемых кепстральных коэффициентов – так специалисты по акустике называют некоторые важнейшие математические характеристики аудиосигналов, обычно рассчитываемые для коротких фрагментов аудиозаписей длительностью от 20 до 40 микросекунд.
По словам ученого, работа над данной системой началась в 2022 году, и тогда это была чисто академическая задача, поскольку подделка голосов в это время требовала больших ресурсов и не была распространена. На первом этапе поддержку проекта оказал Фонд содействия развитию малых форм предприятий в научно-технической сфере (Фонд содействия инновациям).
Однако, к 2024 году технологии подделки голоса стали гораздо доступнее и получили большое распространение – в частности, стали широко использоваться мошенниками. Таким образом, у первоначально научной разработки появились перспективы прикладного использования. Группа Дмитрия Ефанова участвовала в Технологическом акселераторе МИФИ и Госкорпорации «Росатом» - «Сипуха» стала одним из 4 финалистов акселератора (из первоначальных 60 заявок).
Дмитрий Ефанов подчеркивает, что сегодня задачей разработчиков «Сипухи» является создание облачного сервиса, который позволит легко и быстро подключать функцию распознания дипфейков к любой нуждающейся в этом публичной или коммерческой системе коммуникации – например к колл-центру или мессенджеру. Заинтересованность в использовании сервиса уже подтвердили такие известные российские компании, как «ТБанк» и «Информзащита». В перспективе также необходимо создание исследовательской лаборатории, в которой на регулярной основе будет совершенствоваться нейронная сеть - ведь постоянно появляются новые алгоритмы синтеза дипфейков.
Ученые надеются, что проект получит поддержку со стороны соответствующих структур Правительства Москвы.
