Еженедельник Свет в Интернет

Главная

Новости

Статьи и обзоры
  Горожанин
  Обнинск в Internet
  Web Design
  Hardware
  Software
  Безопасность
  Серфинг
  Игродром
  Relax
  Технологии
  Web-обзор
  Интернет-ликбез
  Опросник
  УП-Технологии
  ART.net

Ссылки

Архив

О нас

Контакты

Форумы


Основатель:
К.Николаенко

Главный Редактор:
С.Коротков

Web Design:
Neutron


Наш спонсор






Порт POPULAR.RU
POPULAR.RU RegionalBanner Network.






Океан


НПП Метра - промышленные электронные автомобильные вагонные весы
Goldy Interior - салон офисной мебели: кабинеты руководителей, мебель для персонала

= Безопасность =

ФИЛЬТРАЦИЯ СПАМА ПО БАЙЕСУ

НЕМНОГО ТЕОРИИ: НЕДОСТАТКИ СУЩЕСТВУЮЩИХ МЕТОДОВ ФИЛЬТРАЦИИ

Наверное, каждый пользователь, активно пользующийся электронной почтой и "живущий" в Интернете несколько лет, сталкивается с проблемой нежелательных массовых рассылок (спама). Особенно если он использует свой адрес для подписки на публичные дискуссионные листы, или опубликовал его в открытом виде на каком-нибудь сайте или доске объявлений…
Поначалу спам не вызывает никаких проблем, кроме легкой досады. Однако с увеличением количества подобных писем даже элементарная операция сортировки почты на "нужное" и "мусор" начинает занимать непозволительно много времени, не говоря уже о том, что весь мусор приходится, к тому же скачивать из Интернета.
В ответ на возникающий в такой ситуации вопрос: "Что делать?", - в Интернете в настоящий момент можно найти довольно большое количество всевозможных фильтров, защищающих почтовый ящик от мусора. Принципы их работы самые разные. Простейшие содержат некоторую базу "запрещенных" и "разрешенных" слов или фраз, при наличии которых входящее письмо может либо беспрепятственно попасть в ящик, либо же быть безжалостно удаленным еще на "входе". К одному из вариантов подобной фильтрации относится, в частности, фильтрация по публичным smtp-серверам, которые используют спамеры для своих рассылок. Другой метод блокировки - отправлять в ответ на каждое письмо запрос на подтверждение, в расчете на то, что хороший человек на него непременно ответит, а спамеры - проигнорируют.
Недостатки обоих методов очевидны: в первом случае используется база слов, которую тоже кто-то должен составлять. Из-за этого по иронии судьбы смысл работы фильтра меняется на противоположный: вместо того, чтобы избавиться от чтения спама, вам как раз приходится читать и анализировать его, пытаясь выявить очередные примечательные слова, которыми можно пополнить базу данных фильтра. Но даже в этом случае, спамеру достаточно в очередной раз написать в письме вместо "корова" - "карова", чтобы его письмо снова беспрепятственно оказалось в вашем ящике.
Второй случай, с запросом на подтверждение, опять же, неудобен обычным отправителям, которым приходится фактически отправлять вам два письма, - "информационное" и "утвердительное". К тому же слабым местом подобного метода является допущение, что спамер ни в коем случае не будет подтверждать намерение попасть к вам в ящик, а также то, что обратный адрес спамерского письма всегда фиктивен. Оба утверждения, как показывает практика, весьма неоднозначны. Обратный адрес может быть не выдуманным, а случайно или специально совпадать с адресом существующего человека. Тогда он, скорее всего, ради любопытства ответит на пришедшее непонятно откуда письмо-подтверждение - и тем самым письмо спамера будет доставлено до адресата, а сам он, ничего не подозревая, может запросто попасть в чей-нибудь "черный список". Вероятность такого невольного ответа довольно велика: если пользователь, чей адрес поставлен вместо обратного, активно пользуется почтой, он может просто автоматически подтвердить доставку, не разбираясь, что это за письмо. Если же пользователь неопытен, то он просто нажмет "oтветить" ради любопытства. Опять же, далеко не все почтовые серверы корректно рапортуют о недоставленной почте. Корректно --в смысле , что исходное письмо прилагается в виде вложения, а текст отчета содержит только техническую информацию о нем. Бывает, что сервер просто отсылает письмо назад в неизменном виде - а это значит, что если это было письмо-запрос на подтверждение, то прогграмма-фильтр вполне может принять его именно за корректное подтверждение доставки. Наконец, если игра будет стоить свеч, то вполне могут появиться программы массовой рассылки, которые будут отправлять подобные подтверждения, - и метод "свой-чужой" потеряет свои плюсы.
Практически все множество существующих на данный момент антиспамерских фильтров базируются на этих двух принципах. Отличаются же они, как правило, "мощностью" спамерской базы, а также регулярностью и степннью ее обновления.
Как правило, антиспамерские филтры выполняются как службы-демоны (daemon) на почтовом сервере, либо же как служебные программы на клиентских рабочих станциях, "висящие" где-нибудь в памяти компьютера, и, естественно, забирающие на себя определенную часть его ресурсов. Если спамерская база подобных фильтров пополняется через Интернет, то эта программа будет расходовать также определенную часть сетевого трафика.
Еще одним существенным недостатком многих антиспамерских фильтров является ориентация их "на Запад". Наш же, "отечественный" спам проходит подобные заграждения довольно легко. Спамеры ведь тоже не стоят на месте: они также пользуются всеми подобными фильтрами, тестируя свою рассылку, чтобы максимально эффективно обмануть все заграждения. И, надо сказать, что возможностей для этого у русского спамера заметно больше, чем у иностранца. Кроме упомянутой "каровы" можно написать "kарова", почти по-английски, заменив (в данном случае) русские буквы на аналогично выглядящие латинские. И такое слово с большой вероятностью пройдет практически через любой "западный" фильтр. Кстати, одна западная антиспамерская компания даже организовала целую лабораторию по борьбе со спамом из России. Причина - упомянутое "частичное транслитерирование".
В общем, битва назойливых спамеров и их адресатов продолжается…

Продолжение следует.

Copyright © Свет в Internet   Designed by Свет в Internet