Список форумов antispamsniper.com/ru antispamsniper.com/ru
Индивидуальные средства защиты от спама
 
 FAQFAQ   ПоискПоиск     ПрофильПрофиль   ВходВход   РегистрацияРегистрация 

Стоп-слова, как использовать?

 
Начать новую тему   Ответить на тему    Список форумов antispamsniper.com/ru -> AntispamSniper для The Bat!
Предыдущая тема :: Следующая тема  
Автор Сообщение
voln



Зарегистрирован: 14.02.2008
Сообщения: 4

СообщениеДобавлено: Чт Фев 14, 2008 6:22 pm    Заголовок сообщения: Стоп-слова, как использовать? Ответить с цитатой

Например, пишу слово spam и вношу его в стоп-слова.
Посылаю письмо со словом spam в теме письма. Однако программа не удаляет такое письмо и пропускает. Объясните, как использовать эту функцию?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
oabox



Зарегистрирован: 03.12.2007
Сообщения: 12

СообщениеДобавлено: Чт Фев 14, 2008 7:06 pm    Заголовок сообщения: Ответить с цитатой

а галочки стоят на "искать стоп-слова..."?
рейтинг спамности у стоп-слова какой выставили?
адрес, с которого послано письмо, не включено в список друзей?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
admin
Автор


Зарегистрирован: 10.02.2006
Сообщения: 816

СообщениеДобавлено: Чт Фев 14, 2008 7:17 pm    Заголовок сообщения: Ответить с цитатой

Вот тут описано более-менее подробно как работает фильтр по стоп-словам:
http://antispamsniper.com/ru/art_stop_words.html
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить сообщения электронной почты
contrlalt



Зарегистрирован: 25.12.2009
Сообщения: 10

СообщениеДобавлено: Пн Dec 28, 2009 12:16 pm    Заголовок сообщения: Ответить с цитатой

Приветствую,

хотел бы уточнить несколько моментов по настройкам "Фильтрация спама по стоп-словам в теме писем" ( http://antispamsniper.com/ru/art_stop_words.html ).
Интересуют пункты настройки:
1. Обновлять список стоп-слов автоматически, при обучении.
Вопрос: а) где можно посмотреть вкл. ли режим обучения в плагине; б) когда и при каких условиях стоп-слово попадает в базу стоп-слов.

2. Минимальный коэффициент спамности для стоп-слов определяет минимальное значение этого коэффициента, при котором слово начинает использоваться для классификации сообщений.
Вопрос: а более доступно можно объяснить что это такое, и что там за циферки: на картинке статьи "10" а в плагине по умолчанию "20".

Благодарю за ответы!
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
admin
Автор


Зарегистрирован: 10.02.2006
Сообщения: 816

СообщениеДобавлено: Пн Dec 28, 2009 12:38 pm    Заголовок сообщения: Ответить с цитатой

contrlalt писал(а):

Интересуют пункты настройки:
1. Обновлять список стоп-слов автоматически, при обучении.
Вопрос: а) где можно посмотреть вкл. ли режим обучения в плагине;

Под обучением прежде всего имеется ввиду то, что вы сами помечаете письма как спам или не спам. Эта функция не отключается. Дополнительно существует автообучение на письмах от адресатов из белого списка и исходящей почте (Фильтрация | Обучение | Автообучение). Так же можно включить автообучение опцией в белом или черном правиле, и для писем распознанных фильтром SpamNet.

contrlalt писал(а):

б) когда и при каких условиях стоп-слово попадает в базу стоп-слов.

Слова из темы писем попадают в список при обучении плагина. При обучении на не-спаме новые слова из темы добавляются в список с нулевым коэффициентом спамности, а для слов уже присутствующих в списке коэффициенты спамности обнуляются и перестают обновляться. При обучении на спаме новые слова из темы добавляются в список с коэффициентом 1, а для слов уже присутствующих в списке коэффициент спамности увеличивается на единицу (только если коэффициент не нулевой, то есть слово не встречалось в нормальной почте).

contrlalt писал(а):

2. Минимальный коэффициент спамности для стоп-слов определяет минимальное значение этого коэффициента, при котором слово начинает использоваться для классификации сообщений.
Вопрос: а более доступно можно объяснить что это такое, и что там за циферки: на картинке статьи "10" а в плагине по умолчанию "20".

Числа во второй колонке это коэффициенты спамности, по сути означающие сколько раз слово встретилось в спаме. Параметр "минимальный коэффициент спамности" определяет нижнюю границу коэффициента спамности, после которой наличие соответствующего слова в теме начинает учитываться при классификации. То есть если например минимум установлен в 20, при классификации будут использоваться только те слова, которые имеют коэффициент спамности выше 20, а все остальные будут игнорироваться.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить сообщения электронной почты
contrlalt



Зарегистрирован: 25.12.2009
Сообщения: 10

СообщениеДобавлено: Пн Dec 28, 2009 2:23 pm    Заголовок сообщения: Ответить с цитатой

admin писал(а):
contrlalt писал(а):

Интересуют пункты настройки:
1. Обновлять список стоп-слов автоматически, при обучении.
Вопрос: а) где можно посмотреть вкл. ли режим обучения в плагине;

Под обучением прежде всего имеется ввиду то, что вы сами помечаете письма как спам или не спам. Эта функция не отключается. Дополнительно существует автообучение на письмах от адресатов из белого списка и исходящей почте (Фильтрация | Обучение | Автообучение). Так же можно включить автообучение опцией в белом или черном правиле, и для писем распознанных фильтром SpamNet.


Мои данные:
AntispamSniper 3.2.2.1
The Bat! pro 4.1.11
Протокол POP3.

А если у меня установлен режим фильтрации "Фильтровать только по заголовкам" о каком либо обучении плагине, в частности по стоп-словам, не может идти и речи?

Как я уже ранее писал, в теме "Доставляется слишком много спама", я проверяю плагином только заголовки, затем Диспетчером Бата удаляю спам и ненужную мне корреспонденцию. Спам я вообще не принимаю на компьютер, как и письма от непонятных отправителей с непонятными темами и объемом - удаляю прямо на сервере.

Так вот, ранее, у меня плагин работал в таком же режиме как и сейчас (я никогда не обучал плагин на принятом спаме - ибо я спам не принимаю, см. выше). Но тогда он удалял спам на сервере и в Диспетчер выдавал только максимум 30% (было что и 2% или вообще 0%).
Сейчас же, плагин (с такими же настройками) пропускает максимум 80% спама, и выдает мне это все в Диспетчер. Конечно мне непривычно, и чувствуется разница между старыми 10-35 и сегодняшними 65-80 письмами что приходится там (в Диспетчере) лицезреть.

После переустановки плагина (полностью был удален) прошло больше месяца, каждый день на публичные ящики сваливается по 70-120 спам-писем.
Вот и ломаю голову, что же стало причиной такого падения качества фильтрации спама.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
admin
Автор


Зарегистрирован: 10.02.2006
Сообщения: 816

СообщениеДобавлено: Пн Dec 28, 2009 2:47 pm    Заголовок сообщения: Ответить с цитатой

contrlalt писал(а):
admin писал(а):
contrlalt писал(а):

Интересуют пункты настройки:
1. Обновлять список стоп-слов автоматически, при обучении.
Вопрос: а) где можно посмотреть вкл. ли режим обучения в плагине;

Под обучением прежде всего имеется ввиду то, что вы сами помечаете письма как спам или не спам. Эта функция не отключается. Дополнительно существует автообучение на письмах от адресатов из белого списка и исходящей почте (Фильтрация | Обучение | Автообучение). Так же можно включить автообучение опцией в белом или черном правиле, и для писем распознанных фильтром SpamNet.


Мои данные:
AntispamSniper 3.2.2.1
The Bat! pro 4.1.11
Протокол POP3.

А если у меня установлен режим фильтрации "Фильтровать только по заголовкам" о каком либо обучении плагине, в частности по стоп-словам, не может идти и речи?

Как я уже ранее писал, в теме "Доставляется слишком много спама", я проверяю плагином только заголовки, затем Диспетчером Бата удаляю спам и ненужную мне корреспонденцию. Спам я вообще не принимаю на компьютер, как и письма от непонятных отправителей с непонятными темами и объемом - удаляю прямо на сервере.

Так вот, ранее, у меня плагин работал в таком же режиме как и сейчас (я никогда не обучал плагин на принятом спаме - ибо я спам не принимаю, см. выше). Но тогда он удалял спам на сервере и в Диспетчер выдавал только максимум 30% (было что и 2% или вообще 0%).
Сейчас же, плагин (с такими же настройками) пропускает максимум 80% спама, и выдает мне это все в Диспетчер. Конечно мне непривычно, и чувствуется разница между старыми 10-35 и сегодняшними 65-80 письмами что приходится там (в Диспетчере) лицезреть.

После переустановки плагина (полностью был удален) прошло больше месяца, каждый день на публичные ящики сваливается по 70-120 спам-писем.
Вот и ломаю голову, что же стало причиной такого падения качества фильтрации спама.

Оставьте плагин поработать в стандартном режиме, с полной проверкой на клиенте и на сервере, без ручного удаления писем из диспетчера. При этом обучайте его на спаме и не спаме, на принятой почте. Для заполнения списка стоп-слов может хватить скажем 500-1000 писем помеченных как спам и не спам. Когда список заполнится, можно будет опять вернуться к вашему методу.
Дополнительно обратите внимание на черные правила. Там в списке по умолчанию выделены только наиболее безопасные правила, но можно выделить дополнительно "Not to me" и "Capital letters in subject". Количество спама распознанного по заголовкам должно возрасти.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить сообщения электронной почты
contrlalt



Зарегистрирован: 25.12.2009
Сообщения: 10

СообщениеДобавлено: Пн Dec 28, 2009 3:24 pm    Заголовок сообщения: Ответить с цитатой

Видно и вправду другого способа нет.
Сейчас, как и два года назад, при первом использовании плагина, думаю: отчего не сделать в Диспетчере Бата "Отметить как спам" "Отметить как НЕ спам" и обучаться на сервере.

Надеюсь это всё же когда-то да и появится.
Спасибо за ответы.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
admin
Автор


Зарегистрирован: 10.02.2006
Сообщения: 816

СообщениеДобавлено: Пн Dec 28, 2009 4:21 pm    Заголовок сообщения: Ответить с цитатой

contrlalt писал(а):
Видно и вправду другого способа нет.
Сейчас, как и два года назад, при первом использовании плагина, думаю: отчего не сделать в Диспетчере Бата "Отметить как спам" "Отметить как НЕ спам" и обучаться на сервере.

Надеюсь это всё же когда-то да и появится.
Спасибо за ответы.

Диспетчером занимаются в Ritlabs, плагины доступа к нему не имеют.

На самом деле логичнее было бы отказаться от постоянного использования диспетчера, и дать плагину работать в нормальном режиме, с автоматической фильтрацией загруженных писем на клиенте. Удаление спама по заголовкам нужно в основном для ускорения и улучшения качества фильтрации писем, и для предотвращения загрузки явного спама в почтовый клиент. Удаление писем с сервера вручную это потеря времени, т.к. обученный плагин без проблем справляется с фильтрацией загруженных писем по полному содержимому. Кроме того велика вероятность удалить и потерять нужное письмо с нестандартным заголовком. Автоматические методы конечно тоже ошибаются, но при большом количестве почты человеческий фактор проявляется сильнее.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить сообщения электронной почты
allalone



Зарегистрирован: 11.02.2010
Сообщения: 13

СообщениеДобавлено: Чт Фев 11, 2010 2:14 pm    Заголовок сообщения: Ответить с цитатой

Подскажите, как экспортировать стоп-слова вместе с коэффициентом спамности ? Чтоб при последующем импорте импортировался также коэффициент спамности ?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
admin
Автор


Зарегистрирован: 10.02.2006
Сообщения: 816

СообщениеДобавлено: Чт Фев 11, 2010 4:30 pm    Заголовок сообщения: Ответить с цитатой

allalone писал(а):
Подскажите, как экспортировать стоп-слова вместе с коэффициентом спамности ? Чтоб при последующем импорте импортировался также коэффициент спамности ?

Такой функции не предусмотрено. Можно просто скопировать файл bw.fm из конфигурационной директории, который содержит стоп-слова с коэффициентами.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить сообщения электронной почты
allalone



Зарегистрирован: 11.02.2010
Сообщения: 13

СообщениеДобавлено: Чт Фев 11, 2010 5:01 pm    Заголовок сообщения: Ответить с цитатой

А можно организовать эту функцию в след версии ?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
admin
Автор


Зарегистрирован: 10.02.2006
Сообщения: 816

СообщениеДобавлено: Чт Фев 11, 2010 5:17 pm    Заголовок сообщения: Ответить с цитатой

allalone писал(а):
А можно организовать эту функцию в след версии ?

Выше описано как можно сделать то что вам нужно в текущей версии.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить сообщения электронной почты
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов antispamsniper.com/ru -> AntispamSniper для The Bat! Часовой пояс: GMT +3:00
Страница 1 из 1

 
Перейти:  
Ты не можешь начинать темы
Ты не можешь отвечать на сообщения
Ты не можешь редактировать свои сообщения
Ты не можешь удалять свои сообщения
Ты не можешь голосовать в опросах


Powered by phpBB © 2001, 2005 phpBB Group