Список форумов antispamsniper.com/ru antispamsniper.com/ru
Индивидуальные средства защиты от спама
 
 FAQFAQ   ПоискПоиск     ПрофильПрофиль   ВходВход   РегистрацияРегистрация 

Предложения по улучшению плагина
На страницу Пред.  1, 2, 3 ... 9, 10, 11, 12, 13, 14  След.
 
Начать новую тему   Ответить на тему    Список форумов antispamsniper.com/ru -> AntispamSniper для The Bat!
Предыдущая тема :: Следующая тема  
Автор Сообщение
admin
Автор


Зарегистрирован: 10.02.2006
Сообщения: 816

СообщениеДобавлено: Вс Авг 26, 2007 1:59 am    Заголовок сообщения: Ответить с цитатой

nospam писал(а):

Это правило срабатывает у меня на половину -
при условии что в поле "кому" не мой адрес , а в поле "адрес" тоже что-то написоно- то срабатывает (если смотреть по журналу фильтрации),
а если в поле "кому" не мой адрес , а в поле "адрес" пусто то не срабатывает ! пробовал на v2607 и v2502....
и вообще мой спамер может слать такие письма что вообще нет строки to в заголовке письма - это можно увидеть в текстовом просмотре если нажать F9 на принятом пмсьме...

Если в журнале фильтрации в поле "Адрес" пусто, значит в заголовках письма нет информации в какой конкретно почтовый ящик пришло данное письмо. Так что в общем логично что правило на таких письмах не срабатывало.
В последней версии 2.6.0.9 плагин самостоятельно добавляет в заголовок письма адрес почтового ящика в виде поля "Received: for <mailbox@domain.ru>". Адрес берется из настроек учетной записи в плагине. В случае если домен сервера в настройках отличается от домена в адресе почтового ящика (например адрес mailbox@yandex.ru, POP3 сервер - pop.yandex.ru, логин - mailbox), то нужно прописать и в TheBat и в плагине полный адрес почтового ящика в качестве логина. Т.е. нужно к логину добавить домен. Если логин был mailbox, то будет mailbox@domain.ru. Тогда плагин будет добавлять в заголовок письма правильный адрес mailbox@domain.ru, а не логин@сервер. Если в письме уже указан адрес почтового ящика в поле Received, то оно будет использовано в правиле. Иначе будет использоваться поле которое добавил плагин.
Кстати если поля TO или CC пустые или в них нет адресов, то правило тоже должно срабатывать, т.к. указанного в условии адреса не найдено.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить сообщения электронной почты
admin
Автор


Зарегистрирован: 10.02.2006
Сообщения: 816

СообщениеДобавлено: Вс Авг 26, 2007 2:03 am    Заголовок сообщения: Ответить с цитатой

NapA писал(а):
nospam
Сделай так:
Создай правило в черном списке и внутри этого правила создай условия.
not Header {To} =~ adress1@domain\.com
not Header {To} =~ adress2@domain\.com
not Header {To} =~ adress3@domain\.com
not Header {To} =~ adress4@domain\.com
not Header {To} =~ adress5@domain\.com
not Header {To} =~ adress6@domain\.com
и т.д для всех адресов.
Если не захочешь получать письма, например, на адрес adress4@domain\.com, то просто сними с этого условия галку.

Это опасное правило. Все письма будут удаляться из постового ящика если забыть добавить его адрес в список. Кроме этого удалятся письма с правильным адресом в CC.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить сообщения электронной почты
admin
Автор


Зарегистрирован: 10.02.2006
Сообщения: 816

СообщениеДобавлено: Вс Авг 26, 2007 2:05 am    Заголовок сообщения: Ответить с цитатой

NapA писал(а):
Цитата:
Это правило срабатывает у меня на половину

Все правильно. Правило срабатывает когда удовлетворены все условия или одно условие сильное.
Чтобы правило работало всегда, создай одно условие для заголовка "To" или отметь это условие как сильное.

Ни в коем случае не надо так делать. Правило удаляет только те письма, которые пришли на определенный адрес, но не содержат его в полях To и CC. Если фильтровать только по полю To, то удалятся все письма из других почтовых ящиков и письма с правильным адресом в поле CC.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить сообщения электронной почты
nospam



Зарегистрирован: 14.08.2007
Сообщения: 20

СообщениеДобавлено: Чт Авг 30, 2007 2:03 pm    Заголовок сообщения: Ответить с цитатой

Теперь
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
pivasik



Зарегистрирован: 30.10.2007
Сообщения: 4

СообщениеДобавлено: Вт Окт 30, 2007 1:15 am    Заголовок сообщения: Ответить с цитатой

Добавьте в окошко ввода правил поле для тестирования активной совокупности или отдельного правила - это намного упростит составление. А по поводу внешней утилиты (RegExpCheck) - или выкинуть ее или хотя бы добавить обработку модификаторов для регулярного выражения: не понимает она, если написать /viagra/i, например.

Как вариант сделать на сервере базу регулярных выражений, которая будет пополняться разработчиками или желающими (тыкнуть кнопку после создания правила, чтоб расшарить правило с другими пользователями). Вновь закачанные с сервера правила изначально неактивны. Плюс так можно апдейтить старые правила.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
pivasik



Зарегистрирован: 30.10.2007
Сообщения: 4

СообщениеДобавлено: Вт Окт 30, 2007 1:25 am    Заголовок сообщения: Ответить с цитатой

Сделать для тестового режима возможность показывать коэффициент для письма, на которое наведен "прицел" или активного. А также дополнительую информацию - какое правило сработало, например.

Кстати, при импорте правил сделайте проверку на дубликаты, а то получается что плаг поставляется с набором правил + проимпортились частично те же самые правила.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
admin
Автор


Зарегистрирован: 10.02.2006
Сообщения: 816

СообщениеДобавлено: Вт Окт 30, 2007 10:25 am    Заголовок сообщения: Ответить с цитатой

pivasik писал(а):
Добавьте в окошко ввода правил поле для тестирования активной совокупности или отдельного правила - это намного упростит составление.

Для тестирования правил в плагине предусмотрен режим тестирования. В этом режиме плагин классифицирует письма письма отправляемые на обучение (реального обучения не происходит) и записывает результаты в журнал.

pivasik писал(а):

А по поводу внешней утилиты (RegExpCheck) - или выкинуть ее или хотя бы добавить обработку модификаторов для регулярного выражения: не понимает она, если написать /viagra/i, например.

Уберите из выражения элементы синтаксиса Perl - //i. Они не относятся к самому регулярному выражению, и не используются ни плагинами ни RegExpCheck. Сравнения всегда происходят с игнорированием регистра символов строк выражения и текста писем.

pivasik писал(а):

Как вариант сделать на сервере базу регулярных выражений, которая будет пополняться разработчиками или желающими (тыкнуть кнопку после создания правила, чтоб расшарить правило с другими пользователями). Вновь закачанные с сервера правила изначально неактивны. Плюс так можно апдейтить старые правила.

Правила предусмотрены только для продвинутых пользователей. Плагин неплохо работает и без них, поэтому добавлять какие-то новые правила имеет смысл для "тонкого тюнинга", когда например хочется чтобы с сервера удалось больше спама с определенными особенностями.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить сообщения электронной почты
admin
Автор


Зарегистрирован: 10.02.2006
Сообщения: 816

СообщениеДобавлено: Вт Окт 30, 2007 10:26 am    Заголовок сообщения: Ответить с цитатой

pivasik писал(а):
Сделать для тестового режима возможность показывать коэффициент для письма, на которое наведен "прицел" или активного. А также дополнительую информацию - какое правило сработало, например.

Эта информация есть в журнале фильтрации.

pivasik писал(а):

Кстати, при импорте правил сделайте проверку на дубликаты, а то получается что плаг поставляется с набором правил + проимпортились частично те же самые правила.

При импортировании правила сверяются по имени.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить сообщения электронной почты
pivasik



Зарегистрирован: 30.10.2007
Сообщения: 4

СообщениеДобавлено: Вт Окт 30, 2007 1:25 pm    Заголовок сообщения: Ответить с цитатой

Цитата:
Эта информация есть в журнале фильтрации.

Для этого должен быть открыт журнал фильтрации, который занимает достаточно места на экране. Кстати, как его открыть в немодальном режиме? И раз уж эта информация все-равно есть, то отобразить ее в хинте не составит труда. User-friendly, так сказать.

Цитата:
При импортировании правила сверяются по имени.

Поскольку урлы запрещены в любом виде, то по хттп здесь картинка:
img87.imageshack.us/my.php?image=40671744bm8.png
Версия плага: 2.7.1.1 - Free
Версия бата: 3.99.4
Environment: xp pro sp2 (+all updates, exept ie7), ie6

Цитата:
Для тестирования правил в плагине предусмотрен режим тестирования. В этом режиме плагин классифицирует письма письма отправляемые на обучение (реального обучения не происходит) и записывает результаты в журнал.

Для использования журнала мне необходимо:
- Открыть конфигурацию
- Открыть окно правил
- Создать правило
- Заполнить его, пока держится в голове
- Сохранить
- Закрыть окно правил
- Включить тестовый режим
- Закрыть окно настроек
- Проестировать несколько писем, под которые писалось это правило
- Открыть конфигурацию
- Посмотреть лог
- Повторить операцию

При наличии дополнительной строчки в окне формирования правила для тестирования регулярного выражения список сокращается втрое.
А если добавить еще и подобное поле в манагер правил, для тестирования совокупности - это вообще рай был бы. И не надо никаких утилит.

Цитата:
Уберите из выражения элементы синтаксиса Perl - //i. Они не относятся к самому регулярному выражению, и не используются ни плагинами ни RegExpCheck.

Они относятся к самому регулярному выражению и являются как раз строкой, используемой в функциях php, например, на которые вы даете ссылки в статье. Собственно, не страшно, но могли бы и написать о том, что они не используются где-то на видном месте.

Цитата:
Правила предусмотрены только для продвинутых пользователей. Плагин неплохо работает и без них, поэтому добавлять какие-то новые правила имеет смысл для "тонкого тюнинга", когда например хочется чтобы с сервера удалось больше спама с определенными особенностями.

Во-первых, я самодовольно причисляю себя к продвинутым пользователям. Во-вторых, плагин после обработки 1.3к сообщений с обучением отлавливает только 5% спама на текущий момент. Как прокоментировали на другом форуме, что такое возможно если я "сломал базу": неправильно хотя бы один раз отметил спам, например как хам. И как решение - очистить базу и начать все сначала.
Я, пока, не владелец коммерческой лицензии, но при такой устойчивости к ошибкам пользователя (если это действительно причина) я им вряд ли стану.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
admin
Автор


Зарегистрирован: 10.02.2006
Сообщения: 816

СообщениеДобавлено: Вт Окт 30, 2007 1:56 pm    Заголовок сообщения: Ответить с цитатой

pivasik писал(а):
Цитата:
Эта информация есть в журнале фильтрации.

Для этого должен быть открыт журнал фильтрации, который занимает достаточно места на экране. Кстати, как его открыть в немодальном режиме? И раз уж эта информация все-равно есть, то отобразить ее в хинте не составит труда. User-friendly, так сказать.

Окно журнала фильтрации не модальное. Его можно сворачивать в таскбар и отображать при необходимости. В плагине для показа журнала можно назначить комбинацию клавиш, на вкладке Настройки.

pivasik писал(а):

Цитата:
При импортировании правила сверяются по имени.

Поскольку урлы запрещены в любом виде, то по хттп здесь картинка:
img87.imageshack.us/my.php?image=40671744bm8.png
Версия плага: 2.7.1.1 - Free
Версия бата: 3.99.4
Environment: xp pro sp2 (+all updates, exept ie7), ie6

Действительно, проверка перестала работать. Это будет исправлено в следующей версии, спасибо.

pivasik писал(а):

Цитата:
Для тестирования правил в плагине предусмотрен режим тестирования. В этом режиме плагин классифицирует письма письма отправляемые на обучение (реального обучения не происходит) и записывает результаты в журнал.

Для использования журнала мне необходимо:
- Открыть конфигурацию
- Открыть окно правил
- Создать правило
- Заполнить его, пока держится в голове
- Сохранить
- Закрыть окно правил
- Включить тестовый режим
- Закрыть окно настроек
- Проестировать несколько писем, под которые писалось это правило
- Открыть конфигурацию
- Посмотреть лог
- Повторить операцию

При наличии дополнительной строчки в окне формирования правила для тестирования регулярного выражения список сокращается втрое.
А если добавить еще и подобное поле в манагер правил, для тестирования совокупности - это вообще рай был бы. И не надо никаких утилит.

В общем случае правило - это одно или несколько условий, которые применяются к разным частям письма. Поэтому полноценно протестировать правило можно только применив его к некоторому письму. Проверить одной строкой можно определенное условие, и для этого есть RegExpCheck.

pivasik писал(а):

Цитата:
Уберите из выражения элементы синтаксиса Perl - //i. Они не относятся к самому регулярному выражению, и не используются ни плагинами ни RegExpCheck.

Они относятся к самому регулярному выражению и являются как раз строкой, используемой в функциях php, например, на которые вы даете ссылки в статье. Собственно, не страшно, но могли бы и написать о том, что они не используются где-то на видном месте.

К синтаксису регулярного выражения не относятся управляющие конструкции // и модификаторы. Они используются в языках программирования, но во всех остальных случаях в них нет необходимости.

pivasik писал(а):

Цитата:
Правила предусмотрены только для продвинутых пользователей. Плагин неплохо работает и без них, поэтому добавлять какие-то новые правила имеет смысл для "тонкого тюнинга", когда например хочется чтобы с сервера удалось больше спама с определенными особенностями.

Во-первых, я самодовольно причисляю себя к продвинутым пользователям. Во-вторых, плагин после обработки 1.3к сообщений с обучением отлавливает только 5% спама на текущий момент. Как прокоментировали на другом форуме, что такое возможно если я "сломал базу": неправильно хотя бы один раз отметил спам, например как хам. И как решение - очистить базу и начать все сначала.
Я, пока, не владелец коммерческой лицензии, но при такой устойчивости к ошибкам пользователя (если это действительно причина) я им вряд ли стану.

Чтобы добиться такого результата нужно было совершить очень много ошибок при обучении, т.е. пометить как не спам большое количество спама. В этом случае поможет только полная очистка базы классификации и обучение плагина заново.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить сообщения электронной почты
pivasik



Зарегистрирован: 30.10.2007
Сообщения: 4

СообщениеДобавлено: Вт Окт 30, 2007 5:49 pm    Заголовок сообщения: Ответить с цитатой

Окно журнала действительно не модальное, но про горячие клавиши не знал - неочевидно это.

Цитата:
В общем случае правило - это одно или несколько условий, которые применяются к разным частям письма. Поэтому полноценно протестировать правило можно только применив его к некоторому письму. Проверить одной строкой можно определенное условие, и для этого есть RegExpCheck.

Это разговор слепого с глухим. Я вам предлагаю ввести фичу (возможно, только для коммерческой версии), чтоб продукт лучше покупали - а вы мне говорите, что вас фичи не интересуют.
Представьте себе Word у которого печать документов вынесли во внешнюю утилиту, которую дополнительно нужно скачивать черт знает откуда.
Без проблем - на нет и суда нет.
+ для корпоративных клиентов было бы интересно иметь или общие настройки на сервере или возможность их импорта/экспорта/синхронизации

Цитата:
Чтобы добиться такого результата нужно было совершить очень много ошибок при обучении, т.е. пометить как не спам большое количество спама.

Вот здесь типовой кусок лога, на котором видно, что все что попадает в spam - это следствие процесса обучения.
img99.imageshack.us/my.php?image=89792475nm4.png

А вот здесь видна статистика, но! Нужно учесть, что из 993 сообщений задетекченых как спам 591 сообщение - результат обучения. Эффективность работы плага получается максимум 5%.
img504.imageshack.us/my.php?image=74452156oh6.png
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
admin
Автор


Зарегистрирован: 10.02.2006
Сообщения: 816

СообщениеДобавлено: Вт Окт 30, 2007 6:24 pm    Заголовок сообщения: Ответить с цитатой

pivasik писал(а):

Цитата:
Чтобы добиться такого результата нужно было совершить очень много ошибок при обучении, т.е. пометить как не спам большое количество спама.

Вот здесь типовой кусок лога, на котором видно, что все что попадает в spam - это следствие процесса обучения.
img99.imageshack.us/my.php?image=89792475nm4.png

А вот здесь видна статистика, но! Нужно учесть, что из 993 сообщений задетекченых как спам 591 сообщение - результат обучения. Эффективность работы плага получается максимум 5%.
img504.imageshack.us/my.php?image=74452156oh6.png

Судя по скриншоту с качеством классификации все в порядке. Эффективность фильтрации можно оценить по первому параметру из списка: Error rate = False positives + False negatives. Значение 3.68% означает процент неправильно распознанных писем от общего количества принятой почты. "Неправильно распознанных" здесь означает что спам классифицировался с рейтингом ниже 85%, а не-спам с рейтингом выше 15%. Таким образом из 591 письма отправленных на обучение как спам, реально распознавались с рейтингом ниже 85% только 591 * 3.61 / 1330 = 1.6% писем. Плагин классифицирует письма перед обучением, и правильно распознанные письма в базу не попадают.

Проверьте рейтинговый порог в TheBat (Настройка The Bat! | Защита от спама). Параметр "Перемещать в папку для спама, если рейтинг более" не должен быть слишком высоким. Нормальное значение по умолчанию для рейтингового порога - 60. Чтобы уменьшить вероятность ошибок типа false positive (распознавание не-спама как спам) можно увеличить порог до 80-85. Устанавливать более высокие значения не стоит, т.к. перестанет перемещаться в папку для спама явный спам с более низким рейтингом.

Не устанавливайте вместе несколько антиспам плагинов. Качество классификации от этого только уменьшается, независимо от способа подсчета общего рейтинга для писем.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить сообщения электронной почты
Владимир Коротков



Зарегистрирован: 09.11.2007
Сообщения: 5

СообщениеДобавлено: Пт Ноя 09, 2007 12:08 pm    Заголовок сообщения: Ответить с цитатой

У меня много доменов и более 30 ящиков и спама приходить несколько сотен в день. Можно ли сделать, чтобы если писем много с одним и тем же содержанием, то он их удалял, а если только 1 то сохранил, или на крайняк в спам. Просто по слову "заявка" столько спама, что он сразу удаляет, и сегодня увидел, что 1 письмо в спаме, а это клиент. Т.е. удалять надо когда письма повторяются и на других почт. ящиках, если не повторяются то проходят.
Надеюсь смысл понятен?[/list]
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
admin
Автор


Зарегистрирован: 10.02.2006
Сообщения: 816

СообщениеДобавлено: Пт Ноя 09, 2007 1:02 pm    Заголовок сообщения: Ответить с цитатой

Владимир Коротков писал(а):
У меня много доменов и более 30 ящиков и спама приходить несколько сотен в день. Можно ли сделать, чтобы если писем много с одним и тем же содержанием, то он их удалял, а если только 1 то сохранил, или на крайняк в спам. Просто по слову "заявка" столько спама, что он сразу удаляет, и сегодня увидел, что 1 письмо в спаме, а это клиент. Т.е. удалять надо когда письма повторяются и на других почт. ящиках, если не повторяются то проходят.
Надеюсь смысл понятен?


Плагин получает сообщения для классификации от почтового клиента в порядке их загрузки по очереди, и должен обязательно выдать рейтинг для каждого письма. Т.е. получить сначала все письма, найти дубликаты и уже после этого выдать рейтинги используя существующий API TheBat невозможно. В принципе можно было бы классифицировать первое письмо из повторяющихся как обычно, а остальные уже сравнивать с предыдущими и удалять похожие. Но этот метод позволяет совсем немного улучшить распознавание спама в одном конкретном случае - когда все дубликаты загружены одновременно, за одну проверку почты. Если дубликаты приходят не одновременно, они и так в дальнейшем распознаются классификатором после обучения на первом из них.

В вашем случае как я понял письмо было распознано как спам по стоп-слову в теме. Если такое происходит часто даже после обучения плагина на большом количестве не-спама, есть смысл отключить фильтр по стоп-словам или изменить его настройки. Конкретно можно увеличить минимально необходимый рейтинг слова (значение можно подобрать ориентируясь по рейтингам слов в вашем списке) и минимальное количество стоп-слов для блокировки письма. Когда плагин ищет 2 стоп-слова вместо одного, вероятность ошибки снижается на порядок. Процент распознанного спама по стоп-словам при этом тоже снизится, но с хорошо обученным классификатором это не должно заметно сказаться на качестве фильтрации спама.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить сообщения электронной почты
Elenhil



Зарегистрирован: 13.11.2006
Сообщения: 42

СообщениеДобавлено: Сб Ноя 24, 2007 4:04 pm    Заголовок сообщения: Ответить с цитатой

Хотелось бы иметь возможность раздельно включать фильтрацию по IP, ключевым словам и черным правилам для разных ящиков. В идеале - еще и выборочно устанавливать необходимое для удаления число и вес спамных ключевых слов в заголовке и число вхождений в DNSBL.

Потому что есть ящики разной заспамленности - к ним хотелось бы применять разной "жесткости" меры.

Я, например, наиболее махровый спам (среди уже положительно оцененного спамообороной Яндекса) перенаправляю на отдельный ящик, который скачиваю с довольно жесткими правилами на удаление - в результате у меня почти половина спама удаляется при скачивании (а всего спама почти 70% от общего числа писем).

Вероятность суммарного false positive и у спамообороны Яндекса, и у моих правил для перенаправления, и у самого плагина весьма мала (меня вполне устраивает), поэтому это намного более безопасный способ не только определения, но и удаления спама (это ведь тоже актуальная задача - удалять спам надо, делать это по жестким одинарным условиям небезопасно, а вручную перед удалением проверять на false positive при больших объемах нереально).

Единственная проблема - такие жесткие условия не позволяют включать проверку по заголовкам для других, менее заспамленных щиков. Между тем, и на них тоже иногда проходит спам, который можно было бы безопасно отфильтровать менее жесткими условиями (скажем, четыре вхождения в DNSBL, два черных слова с высоким весом в заголовке). Вот сделать это раздельно для разных ящиков мне бы и хотелось
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов antispamsniper.com/ru -> AntispamSniper для The Bat! Часовой пояс: GMT +3:00
На страницу Пред.  1, 2, 3 ... 9, 10, 11, 12, 13, 14  След.
Страница 10 из 14

 
Перейти:  
Ты не можешь начинать темы
Ты не можешь отвечать на сообщения
Ты не можешь редактировать свои сообщения
Ты не можешь удалять свои сообщения
Ты не можешь голосовать в опросах


Powered by phpBB © 2001, 2005 phpBB Group