LAB2 Апухтин М.А. (544693), страница 3
Текст из файла (страница 3)
Программы автоматической фильтрации используют статистический анализ содержания письма для принятия решения, является ли оно спамом. На практике пользуются популярностью методы байесовской фильтрации спама. Для работы этих методов требуется предварительное «обучение» фильтров путем передачи ему рассортированных вручную писем для выявления статистических особенностей нормальных писем и спама.
Метод очень хорошо работает при сортировке текстовых сообщений (в том числе HTML). После обучения на достаточно большой выборке удаётся отсечь до 95—97 % спама. Для обхода таких фильтров спамеры иногда помещают содержательную часть в картинку, вложенную в письмо, текст же либо отсутствует, либо случаен, что не позволяет фильтру составить статистику для распознавания таких писем. В этом случае необходимо пользоваться программами распознавания текста (большинство современных почтовых программ этого не поддерживают), либо использовать другие методы.
Залог надежной работы байесовского метода — постоянное дообучение фильтра и указание ему на совершаемые ошибки. В почтовых программах для этого вводится возможность ручной пометки сообщения «спам/не-спам», а в почтовых сервисах в интернете — кнопка «пожаловаться на спам».
Неавтоматическая фильтрация
Многие программы и почтовые сервисы в интернете позволяют пользователю задавать собственные фильтры. Такие фильтры могут состоять из слов или, реже, регулярных выражений, в зависимости от наличия или отсутствия которых сообщение попадает или не попадает в мусорный ящик. Однако такая фильтрация трудоёмкая и негибкая, кроме того, требует от пользователя известной степени знакомства с компьютерами. С другой стороны, она позволяет эффективно отсеять часть спама, и пользователь точно знает, какие сообщения будут отсеяны и почему.
Чёрные списки
Чёрный список — перечень физических или юридических лиц, занесёный в соответствующий список, которые по каким-либо причинам признаны недружественными по отношению к субъекту-составителю списка. Сообщения от них могут сразу удаляться или помещаться в папку спам.
Настройка фильтрации и сортировки писем в почтовом клиенте
В качестве почтового клиента был использован Mozilla Thunderbird.
Фильтрация была настроена таким образом, чтобы все письма, приходящие с сайта molotok.ru отправлялись в специальную папку. В этой папке настроена сортировка писем по дате отправки в порядке возрастания.
Список использованных источников
-
http://shkolazhizni.ru/archive/0/n-6163/
-
http://ru.wikipedia.org/
-
http://opds.sut.ru/electronic_manuals/mail/1_Struct_el_soob.htm
-
http://www.nextmail.ru/hist/protocol.phtml?t=2
-
http://windows.microsoft.com/ru-RU/windows-vista/POP3-SMTP-and-other-e-mail-server-types