26 февраля 2021

«ВКонтакте» внедряет фильтр враждебных высказываний, который удаляет комментарии с угрозами. Функция доступна в 50 % пабликов

«ВКонтакте» запустила фильтр враждебных высказываний для комментариев в сообществах, рассказали «Бумаге» в пресс-службе компании. Он работает на основе нейросети, администраторы могут включить его в настройках.

Сейчас новая функция появилась у владельцев 50 % пабликов, в скором времени она станет доступна всем. Как сообщили в компании, алгоритмы умеют определять прямые угрозы: пожелания смерти или обещания причинить вред здоровью. При этом тестирование еще продолжается: в будущем фильтр научится распознавать, например, травлю по национальности или религиозной принадлежности.

Тестирование фильтра запустили в ноябре 2020 года. За почти четыре месяца функцией воспользовались руководители более 10 % сообществ, то есть 13 миллионов пабликов, групп и мероприятий, рассказали во «ВКонтакте». Из подключивших фильтр впоследствии от него отказались 1,8 %.

В ноябре 2019 года «ВКонтакте» на один день запустила функцию для борьбы с оскорблениями в комментариях. При попытке написать агрессивный комментарий пользователь получал совет отказаться от обидных слов. Есть ли в тексте признаки оскорблений, определяли алгоритмы соцсети. Эксперимент был призван предотвратить травлю по национальному признаку и издевательства над подростками.

В августе «ВКонтакте» также сообщила о тестировании нейросети для борьбы с языком вражды. Нейросеть должна была ускорить время обработки жалоб и помогать быстрее находить материалы с оскорблениями и угрозами, публикации, которые содержат проявления ксенофобии, расизма, гомофобии, сексизма, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний.

Если вы нашли опечатку, пожалуйста, сообщите нам. Выделите текст с ошибкой и нажмите появившуюся кнопку.

Подписывайтесь, чтобы ничего не пропустить

Все тексты