Квир-сообщества столкнулись с проблемой — ИИ блокирует слова «гей» и «лесбиянка» как ругательства
Научить искусственный интеллект фильтровать нецензурную лексику оказалось сложной задачей.
Научить искусственный интеллект (ИИ) фильтровать нецензурную лексику оказалось сложнее, чем дать ему список запретных слов, пишет Wired. Например, квир-сообщества жалуются на то, что ИИ принимает слова «гей» и «лесбиянка» за оскорбления.
Почти 10 лет назад сотрудники американской компании Shutterstock выложили в открытый доступ список «грязных и неприличных» слов, которые нельзя писать при заливке стоковых фотографий. Сегодня в этом списке 403 слова и эмодзи со средним пальцем. У списка «грязных и неприличных» слов есть версии более чем на 25 языках.
«Слова из списка часто используются в очень оскорбительных выражениях, но они также могут быть уместны в зависимости от контекста и вашей личности», — рассказал Уильям Агню, исследователь машинного обучения в Вашингтонском университете.
Так, на сбои жалуются представители квир-сообщества — ИИ принимает слова «гей» и «лесбиянка» за ругательства. Из-за этого они не могли провести мероприятие в онлайн-формате, ИИ блокировал определения секс-меньшинств в названии конференции.
Русскоязычная версия списка насчитывает 151 пункт. Среди распространенных ругательств и оскорблений присутствуют фразы «какая разница» и «ты мне ваньку не валяй».