«ВКонтакте» запустила фильтр враждебных высказываний для комментариев в сообществах, рассказали «Бумаге» в пресс-службе компании. Он работает на основе нейросети, администраторы могут включить его в настройках.
Сейчас новая функция появилась у владельцев 50 % пабликов, в скором времени она станет доступна всем. Как сообщили в компании, алгоритмы умеют определять прямые угрозы: пожелания смерти или обещания причинить вред здоровью. При этом тестирование еще продолжается: в будущем фильтр научится распознавать, например, травлю по национальности или религиозной принадлежности.
Тестирование фильтра запустили в ноябре 2020 года. За почти четыре месяца функцией воспользовались руководители более 10 % сообществ, то есть 13 миллионов пабликов, групп и мероприятий, рассказали во «ВКонтакте». Из подключивших фильтр впоследствии от него отказались 1,8 %.
В ноябре 2019 года «ВКонтакте» на один день запустила функцию для борьбы с оскорблениями в комментариях. При попытке написать агрессивный комментарий пользователь получал совет отказаться от обидных слов. Есть ли в тексте признаки оскорблений, определяли алгоритмы соцсети. Эксперимент был призван предотвратить травлю по национальному признаку и издевательства над подростками.
В августе «ВКонтакте» также сообщила о тестировании нейросети для борьбы с языком вражды. Нейросеть должна была ускорить время обработки жалоб и помогать быстрее находить материалы с оскорблениями и угрозами, публикации, которые содержат проявления ксенофобии, расизма, гомофобии, сексизма, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний.