Коментари

Копиране на връзка Цитирайте отговор

mailer

rpv-tomsk коментира 28 август 2016 г. •

Имам имейл със следните заглавки:

Това заглавията създава резултати:

комбинацията изглежда твърде силна.

Кой е правилният начин за намаляване на такива резултати?

fatalbanana коментира 28 август 2016 г.

Това може да се направи с композит.

moisseev коментира 28 август 2016 г.

Да, mail.ru кодира в base64 всичко. Използвам настройки .

@fatalbanana бихте ли могли да публикувате пример за композит за този конкретен случай?

встахов коментира 28 август 2016 г.

Така че поща, такава ru, уау!

rpv-tomsk коментира 28 август 2016 г. •

X-Mailer: Mail.Ru Mailer 1.0
Мисля, че трябва да проверя заглавката на X-Mailer и да изградя някакъв символ MAIL_RU_MAILER, който да използвам в композитен.

Трябва ли да проверя и Получаване: от [\\ S +] от e.mail.ru с HTTP; ?

rpv-tomsk коментира 28 август 2016 г. •

Можете ли да проверите коректността на следната конфигурация:

Ще съответства ли тази конфигурация на заглавките в предоставения пример? Не съм сигурен кои модификатори трябва да бъдат приложени и към тези регулярни изрази.

Също така, можете ли да ми предоставите линк към документацията за модификатори (LUA)?

Не разбирам какво означават тук модификаторите/X и/H.

встахов коментира 28 август 2016 г.

rpv-tomsk коментира 28 август 2016 г.

Новият синтаксис за композит, който беше предложен в # 874, може да е добър и в този случай:

Без това трябва да поставим три композитни, за да премахнем всеки заглавен елемент независимо.

встахов коментира 28 август 2016 г.

Не са ви необходими 3 композита.

Освен това не виждам никакви предимства на вашия синтаксис и има голям недостатък: той въвежда още един слой сложност както за потребителите, така и за мен, за да правим разлика между два вида съставни изрази.

rpv-tomsk коментира 28 август 2016 г. •

Имам три съвпадащи символа: FROM_EXCESS_BASE64 (1.50), REPLYTO_EXCESS_BASE64 (1.50), TO_EXCESS_BASE64 (1.50)

Как да деактивирам всички от тях чрез единичен композит?

В момента поставих следната конфигурация:

И тази конфигурация премахва/замества само един, първи символ FROM_EXCESS_BASE64 .

rpv-tomsk коментира 28 август 2016 г. •

Току-що проверих тази конфигурация на Lua:

АКТУАЛИЗИРАН. Добавен липсващ локален reconf = config ['regexp'] .
Тази конфигурация започва да работи.

xpunkt коментира 28 август 2016 г.

само един \ е необходим за изкопаване, опитайте да направите \ за единичен \

встахов коментира 28 август 2016 г.

@xpunkt: Не, грешиш.

rpv-tomsk коментира 28 август 2016 г.

Не, двойно \ е взето от съществуващите конфигурации.

Добавен е следният композит и нещата започват да работят според очакванията:

moisseev коментира 28 август 2016 г.

@vstakhov Какво ще кажете за подхода на Lua API? По-бързо ли е от regexp?

встахов коментира 28 август 2016 г. •

Rspamd регулярните изрази са невероятно бързи поради много фактори. Всъщност, ако използвате Rspamd с Hyperscan (което трябва да направите за всички съвременни хардуерни платформи със SSSE3), новите регулярни изрази не увеличават времето за сканиране на съобщенията (дори за регулярните регулярни изрази на тялото). Алгоритмичната сложност на SA regexp е подобна на O (N * M), където N е дължината на сканираните данни, а M е броят на регулярните изрази. За Rspamd и Hyperscan е по-близо до O (N + M): грубо казано, всички регулярни изрази се изпълняват едновременно. Трябва обаче да избягвате обратното проследяване и други несъвместими функции (напр. Поглед назад).

Обажданията от Lua са относително скъпо. Мисля, че трябва да предоставя повече подробности за това. Може би ще го направя в бъдеще.

rpv-tomsk коментира 29 август 2016 г. •

Напълно не е ясно какви условия се оценяват НЕ мързеливо.
Това е нечисто както за начинаещи, така и за членове на екипа. Следният пример/ангажименти потвърждават това:

Мисля, че това поведение трябва да бъде документирано изрично.

Също така е нечисто да използвам | или || . Документация https://rspamd.com/doc/configuration/composites.html кажете да използвате ИЛИ | - съответства на true, ако някой операнд е верен, но примерите на същата страница използват || .

fatalbanana коментира 29 август 2016 г.

Всъщност не съм сигурен, че композитите са полезни тук. Начинът, по който бих направил това, вероятно би бил да добавя тези символи към обща група и да използвам max_score в метрика.