Квир-сообщества столкнулись с проблемой — ИИ блокирует слова «гей» и «лесбиянка» как ругательства

Научить искусственный интеллект фильтровать нецензурную лексику оказалось сложной задачей.

Научить искусственный интеллект (ИИ) фильтровать нецензурную лексику оказалось сложнее, чем дать ему список запретных слов, пишет Wired. Например, квир-сообщества жалуются на то, что ИИ принимает слова «гей» и «лесбиянка» за оскорбления.

Почти 10 лет назад сотрудники американской компании Shutterstock выложили в открытый доступ список «грязных и неприличных» слов, которые нельзя писать при заливке стоковых фотографий. Сегодня в этом списке 403 слова и эмодзи со средним пальцем. У списка «грязных и неприличных» слов есть версии более чем на 25 языках.

«Слова из списка часто используются в очень оскорбительных выражениях, но они также могут быть уместны в зависимости от контекста и вашей личности», — рассказал Уильям Агню, исследователь машинного обучения в Вашингтонском университете.

Так, на сбои жалуются представители квир-сообщества — ИИ принимает слова «гей» и «лесбиянка» за ругательства. Из-за этого они не могли провести мероприятие в онлайн-формате, ИИ блокировал определения секс-меньшинств в названии конференции.

Русскоязычная версия списка насчитывает 151 пункт. Среди распространенных ругательств и оскорблений присутствуют фразы «какая разница» и «ты мне ваньку не валяй».

Источник

Поделись публикацией

Комментарии закрыты.