Обманывать детекторы фейковых новостей с помощью злонамеренных комментариев пользователей

Тем не менее, новое исследование, проведенное командой Колледжа информационных наук и технологий Пенсильванского университета, показывает, как этими детекторами фальшивых новостей можно манипулировать с помощью комментариев пользователей, чтобы пометить истинные новости как ложные, а ложные – как истинные. Такой подход к атаке может дать злоумышленникам возможность влиять на оценку детектора истории, даже если они не являются ее первоначальным автором.
«Наша модель не требует от злоумышленников изменять заголовок или содержание целевой статьи», – пояснил Тай Ле, ведущий автор статьи и докторант Колледжа IST. "Вместо этого злоумышленники могут легко использовать случайные учетные записи в социальных сетях для размещения вредоносных комментариев, чтобы либо понизить реальную историю как фейковые новости, либо продвинуть фальшивую историю как настоящую."

То есть, вместо того, чтобы обмануть детектор, атакуя контент или источник статьи, комментаторы могут атаковать сам детектор.
Исследователи разработали фреймворк под названием Malcom для генерации, оптимизации и добавления вредоносных комментариев, которые были удобочитаемы и имели отношение к статье, чтобы обмануть детектор. Затем они оценили качество искусственно созданных комментариев, выяснив, могут ли люди отличить их от комментариев, созданных реальными пользователями.

Наконец, они проверили работу Malcom на нескольких популярных детекторах фейковых новостей.
Malcom работал лучше, чем базовый уровень для существующих моделей, обманывая пять ведущих детекторов фейковых новостей, основанных на нейронных сетях, более чем в 93% случаев. Насколько известно исследователям, это первая модель, которая атакует детекторы фейковых новостей с помощью этого метода.

Такой подход может быть привлекательным для злоумышленников, поскольку им не нужно следовать традиционным шагам по распространению фейковых новостей, что в первую очередь связано с владением контентом. Исследователи надеются, что их работа поможет тем, кто занимается созданием детекторов фейковых новостей, разработать более надежные модели и усилить методы обнаружения и фильтрации вредоносных комментариев, что в конечном итоге поможет читателям получить точную информацию для принятия обоснованных решений.

«Фейковые новости продвигаются с преднамеренным намерением усилить политические разногласия, подорвать доверие граждан к общественным деятелям и даже вызвать путаницу и сомнения среди сообществ», – написала команда в своей статье, которая будет представлена ​​виртуально во время IEEE 2020 года. Международная конференция по интеллектуальному анализу данных.
Ле добавила: «Наше исследование показывает, что злоумышленники могут использовать эту зависимость от активности пользователей, чтобы обмануть модели обнаружения, размещая вредоносные комментарии в онлайн-статьях, и подчеркивает важность наличия надежных моделей обнаружения фейковых новостей, которые могут защитить от враждебных атак."

Среди авторов проекта – доцент Донгвон Ли и доцент Суханг Ван из Колледжа информационных наук и технологий Пенсильванского государственного университета. Работа поддержана Национальным научным фондом.