Квир-сообщества столкнулись с проблемой — ИИ блокирует слова «гей» и «лесбиянка» как ругательства

Опубліковано 12.02.2021

Научить искусственный интеллект фильтровать нецензурную лексику оказалось сложной задачей.

Научить искусственный интеллект (ИИ) фильтровать нецензурную лексику оказалось сложнее, чем дать ему список запретных слов, пишет Wired. Например, квир-сообщества жалуются на то, что ИИ принимает слова «гей» и «лесбиянка» за оскорбления.

Почти 10 лет назад сотрудники американской компании Shutterstock выложили в открытый доступ список «грязных и неприличных» слов, которые нельзя писать при заливке стоковых фотографий. Сегодня в этом списке 403 слова и эмодзи со средним пальцем. У списка «грязных и неприличных» слов есть версии более чем на 25 языках.

«Слова из списка часто используются в очень оскорбительных выражениях, но они также могут быть уместны в зависимости от контекста и вашей личности», — рассказал Уильям Агню, исследователь машинного обучения в Вашингтонском университете.

Так, на сбои жалуются представители квир-сообщества — ИИ принимает слова «гей» и «лесбиянка» за ругательства. Из-за этого они не могли провести мероприятие в онлайн-формате, ИИ блокировал определения секс-меньшинств в названии конференции.

Русскоязычная версия списка насчитывает 151 пункт. Среди распространенных ругательств и оскорблений присутствуют фразы «какая разница» и «ты мне ваньку не валяй».

Источник

Сподобалось? Знайди хвилинку, щоб підтримати нас на Patreon!

Поділись публікацією

IT США