Jump to content

Фильтр слов

Фильтр слов (иногда называемый просто « фильтр » или « цензор ») — это сценарий, обычно используемый на интернет-форумах или в чатах , который автоматически сканирует сообщения или комментарии пользователей по мере их отправки и автоматически изменяет или подвергает цензуре определенные слова или фразы.

Самые простые фильтры слов ищут только определенные строки букв и удаляют или перезаписывают их независимо от контекста. Более продвинутые фильтры слов делают некоторые исключения для контекста (например, фильтруют «попку», но не «масло»), а самые продвинутые фильтры слов могут использовать регулярные выражения .

Фильтры слов могут выполнять любую из множества функций.

Удаление ненормативной лексики

[ редактировать ]

Фильтр ненормативной лексики , также известный как фильтр ненормативной лексики или языковой фильтр, представляет собой программную подсистему, которая изменяет текст для удаления слов, которые администратор или сообщество онлайн-форума считают оскорбительными . Фильтры нецензурной лексики распространены в специально запрограммированных чатах и ​​онлайн-видеоиграх , в первую очередь в MMORPG . Это не следует путать с фильтрацией контента , которая обычно встроена в программы просмотра Интернета сторонними разработчиками для фильтрации или блокировки определенных веб-сайтов или типов веб-сайтов. Фильтры мата обычно создаются или реализуются разработчиками интернет-сервиса.

Чаще всего фильтры слов используются для цензуры языка, который операторы форума или чата считают неприемлемым. Ненормативные слова обычно заменяются частично, полностью или заменяются бессмысленными словами. [1] Это освобождает администраторов и модераторов от необходимости постоянно патрулировать форум на предмет подобных высказываний. Это также может помочь доске объявлений избегать установки программного обеспечения для управления контентом, установленного на компьютерах или в сетях пользователей, поскольку такое программное обеспечение часто блокирует доступ к веб-страницам, содержащим ненормативную лексику.

Отфильтрованные фразы могут быть навсегда заменены при сохранении (пример: phpBB 1.x), либо исходная фраза может быть сохранена, но отображаться как подвергнутый цензуре текст. В некоторых программах пользователи могут просматривать текст за фильтром слов, цитируя сообщение.

Фильтры мата обычно используют функции замены строк, встроенные в язык программирования, использованный для создания программы, для замены списка неподходящих слов и фраз различными альтернативами. Альтернативы могут включать в себя:

  • Бессмысленные символы Grawlix , такие как !@#$%^&*
  • Замена определенной буквы символом номера смены или похожим на него символом.
  • Звездочки (* или #) либо заданной длины, либо длины исходного фильтруемого слова. Альтернативно, на плакатах некоторые буквы часто заменяются звездочкой.
  • Рубленые ругательства , такие как «черт возьми» или «черт», или придуманные слова, такие как «флум».
  • Семейные слова или фразы, эвфемизмы, такие как «ЛЮБЛЮ» или «Я ЛЮБЛЮ ТЕБЯ», или совершенно другие слова, не имеющие ничего общего с исходным словом.
  • Удаление поста. В этом случае блокируется весь пост и исправить это обычно невозможно.
  • Ничего вообще. В этом случае оскорбительное слово удаляется.

Некоторые фильтры мата выполняют простой поиск строки. В других есть меры, которые игнорируют пробелы , а третьи доходят до того, что игнорируют все небуквенно -цифровые символы и затем фильтруют простой текст. Это означает, что если бы слово «ты» было настроено на фильтрацию, слова «ты» или «йо!у» также будут фильтроваться.

Фото контроль

[ редактировать ]

Клише — определенные слова или фразы, постоянно используемые в сообщениях, также известные как «мемы», — часто возникают на форумах. Некоторые пользователи считают, что эти клише добавляют веселья, но другие пользователи находят их утомительными, особенно если ими злоупотреблять. Администраторы могут настроить фильтр слов, чтобы заменить раздражающее клише более неловкой фразой или вообще удалить его.

Борьба с вандализмом

[ редактировать ]

Интернет-форумы иногда подвергаются атакам вандалов , которые пытаются заполнить форум повторяющимися бессмысленными сообщениями, или спамерами , которые пытаются вставить ссылки на их коммерческие веб-сайты. Фильтр слов сайта можно настроить так, чтобы он удалял бессмысленный текст, используемый вандалами, или удалял из сообщений все ссылки на определенные веб-сайты.

Фильтр хромоты

[ редактировать ]

Фильтры хромоты — это текстовые фильтры слов, используемые веб-сайтами на основе Slash (например, текстовыми досками и имиджбордами ) для предотвращения нежелательных публикации комментариев в ответ на истории. Некоторые из вещей, которые они предназначены для фильтрации, включают:

  • Слишком много заглавных букв
  • Слишком много повторений
  • ASCII-искусство
  • Комментарии, которые слишком короткие или длинные
  • Использование HTML-тегов, которые пытаются взломать веб-страницы.
  • Заголовки комментариев, состоящие исключительно из «первого сообщения».
  • Любое появление слова или термина, которые программисты считают оскорбительными/вульгарными.

Обход фильтров

[ редактировать ]

Поскольку фильтры слов автоматизированы и ищут только определенные последовательности символов , пользователи, знающие о фильтрах, иногда пытаются обойти их, изменяя буквы ровно настолько, чтобы избежать фильтров. Пользователь, пытающийся избежать фильтра грубости, может заменить один из символов оскорбительного слова звездочкой, тире или чем-то подобным. Некоторые администраторы в ответ пересматривают фильтры слов, чтобы выявить распространенные замены; другие могут сделать уклонение от фильтра само по себе наказуемым правонарушением. [2] Простым примером обхода фильтра слов может быть ввод символов между буквами или использование leet . Более продвинутые методы обхода фильтра слов включают использование изображений, скрытых тегов или символов кириллицы (т. е. атака с подменой гомографа ).

Другой метод — использовать мягкий дефис . Мягкий дефис используется только для обозначения места разделения слова при разрыве текстовых строк и не отображается. Если поместить это слово в середине слова, оно разобьется и в некоторых случаях не будет распознаваться фильтром слов.

Некоторые более продвинутые фильтры, например, в онлайн-игре RuneScape , могут обнаружить обход. Однако недостатком чувствительных фильтров слов является то, что законные фразы также отфильтровываются.

Аспекты цензуры

[ редактировать ]

Фильтры слов закодированы в интернет-форумах или чатах и ​​работают только с материалами, представленными на соответствующем форуме или в чате. Это отличает словесные фильтры от программного обеспечения для управления контентом , которое обычно устанавливается на ПК конечного пользователя или в компьютерной сети и которое может фильтровать весь интернет-контент, отправляемый на или из рассматриваемого ПК или сети. Поскольку фильтры слов изменяют слова пользователей без их согласия, некоторые пользователи по-прежнему считают это цензурой , а другие считают их приемлемой частью права оператора форума контролировать содержимое форума.

Ложные срабатывания

[ редактировать ]

Общая особенность словесных фильтров, которую пользователи часто считают смешной или раздражающей, заключается в том, что они часто воздействуют на слова, которые не предназначены для фильтрации. Это типичная проблема при фильтрации коротких слов. Например, если слово «задница» подвергнуто цензуре, можно увидеть: «Вам нужна дистанция для исполнения классической музыки?» вместо «Вам нужна помощь в исполнении классической музыки?» Несколько слов могут быть отфильтрованы, если пробелы игнорируются, в результате чего «предположительно» становится «предполагаемым». Запрет на такую ​​фразу, как «жестко», приведет к фильтрации безобидных утверждений, таких как «Это было тяжело!» и «Извини, я был с тобой строг» на «Это было аэ!» и «Извини, я был тобой».

Некоторые слова, случайно отфильтрованные, могут стать заменой ненормативной лексики. Один из примеров этого можно найти на форуме Myst Mystcommunity. Там слово «рукопись» случайно подверглось цензуре из-за того, что оно содержало слово «анус», в результате чего получилось «м****скрипт». Это слово было принято в качестве замены ругательства и перенесено, когда форум переехал, и используется множество заменителей, таких как «скриптинг» (хотя в основном старшими членами сообщества).

Названия мест могут быть непреднамеренно отфильтрованы из-за содержания в них нецензурных слов. В первые годы существования Интернета британский топоним Пенистон часто отфильтровывался фильтрами спама и нецензурной лексики. [3]

Выполнение

[ редактировать ]

Многие игры, такие как World of Warcraft , а в последнее время Habbo Hotel и RuneScape, позволяют пользователям отключать фильтры. Другие игры, особенно бесплатные Массовые многопользовательские онлайн-игры , такие как Knight Online, не имеют такой возможности.

Другие игры, такие как Medal of Honor и Call of Duty (кроме Call of Duty: World at War , Call of Duty: Black Ops , Call of Duty: Black Ops 2 и Call of Duty: Black Ops 3 ), не предоставляют пользователям возможность отключить нецензурную лексику в сценариях, в то время как Gears of War это делает.

Помимо игр, фильтры ненормативной лексики можно использовать для модерации пользовательского контента на форумах, блогах, в приложениях для социальных сетей, на детских сайтах и ​​в обзорах продуктов. Существует множество API-интерфейсов фильтрации ненормативной лексики, таких как WebPurify , которые помогают заменять нецензурные слова другими символами (например, «@#$!»). Эти API-интерфейсы фильтров ненормативной лексики работают с методом поиска и замены ненормативной лексики.

См. также

[ редактировать ]
  1. ^ «Когда, черт возьми, у нас появился фильтр слов?» . Проверено 1 октября 2006 г.
  2. ^ «Условия использования GameFAQ» . Часто задаваемые вопросы по игре . Проверено 4 августа 2008 г.
  3. ^ Ширин, Джуд (29 марта 2010 г.). «Как спам-фильтры определили судьбу канадского журнала» . Би-би-си онлайн . Проверено 5 апреля 2011 г.
[ редактировать ]
  • Онлайн-обфускатор текста — заменяет символы аналогичными символами Юникода из разных наборов символов (например, кириллицы).
  • Текстовый фильтр — онлайн-инструменты для текста: сортировка по алфавиту, удаление дубликатов, удаление всех небуквенно-цифровых символов, только цифр, букв и т. д.
  • Случайные строки — генерирует случайные строки удобочитаемых символов с удаленной ненормативной лексикой.

заменяет символы аналогичными символами Unicode из разных наборов символов (например, кириллицы)

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 89af0c2ec94806202b755d0c1668bd20__1705239420
URL1:https://arc.ask3.ru/arc/aa/89/20/89af0c2ec94806202b755d0c1668bd20.html
Заголовок, (Title) документа по адресу, URL1:
Wordfilter - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)