Вот возникло желание отфильтровать нафик вот такую комбинацию: Content-Type: text/plain; charset="windows-1251" Content-Transfer-Encoding: 7bit X-Mailer: Microsoft Outlook Express 6.00.2800.1081 Я сильно неправ ? -- WBR, Michael Смерть сама по себе не страшна - страшно то, что это уже навсегда. =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
Hi! On Thu, Aug 26, 2004 at 17:09 +0300, Michael Plostak wrote:
Вот возникло желание отфильтровать нафик вот такую комбинацию:
Content-Type: text/plain; charset="windows-1251" Content-Transfer-Encoding: 7bit X-Mailer: Microsoft Outlook Express 6.00.2800.1081
Я сильно неправ ?
Можешь еще text/html туда добавить. -- Victor Cheburkin VCW61, VC319-RIPE, VC1-UANIC =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
Michael Plostak wrote: MP> Вот возникло желание отфильтровать нафик вот такую комбинацию: MP> Content-Type: text/plain; charset="windows-1251" MP> Content-Transfer-Encoding: 7bit MP> X-Mailer: Microsoft Outlook Express 6.00.2800.1081 MP> Я сильно неправ ? Сильно. В случае, если дефолтная кодировка стоит в 1251, и в письме нет ни одного русского символа (читай переписка на аглицком или транслитом), срежешь только так. Уже наступал на этот грабль. Вариант номер два - свериться, чтобы если Outllok+7bit, c-type=text/plain, НО в тексте есть русские буквы, то гоу нафик. Есть типажи, типа Градиля, которые ставят content-type дважды - тоже хороший для фильтрации повод. PS: привет всем семинаристам ;-) -- UKR.NET Postmaster =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Thu, Aug 26, 2004 at 05:37:24PM +0300, vladimir.sharun@ukr.net wrote:
Michael Plostak wrote: MP> Вот возникло желание отфильтровать нафик вот такую комбинацию:
MP> Content-Type: text/plain; charset="windows-1251" MP> Content-Transfer-Encoding: 7bit MP> X-Mailer: Microsoft Outlook Express 6.00.2800.1081
MP> Я сильно неправ ?
Сильно. В случае, если дефолтная кодировка стоит в 1251, и в письме нет ни одного русского символа (читай переписка на аглицком или транслитом), срежешь только так. Уже наступал на этот грабль. Вариант номер два - свериться, чтобы если Outllok+7bit, c-type=text/plain, НО в тексте есть русские буквы, то гоу нафик. Есть типажи, типа Градиля, которые ставят content-type дважды - тоже хороший для фильтрации повод.
Спасибо. Таки был не прав. Вспылил :) А в такой комбинации: charset=1251 && (encoding = 7bit || undef) && subject =~ /[8bit]/ (не проверяем мэйлер, но ловим и тех у кого encoding отсутствует) что скажет умудренный собиратель граблёфф ? :)
PS: привет всем семинаристам ;-)
Ничего, может хоть спамометалки к RFC приведут :)
-- UKR.NET Postmaster
-- WBR, Michael Выкуренная сигарета сокращает жизнь на 2 часа, выпитая бутылка водки на 3 часа, а рабочий день - на 8 часов. =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
Michael Plostak wrote: MP> charset=1251 && (encoding = 7bit || undef) && subject =~ /[8bit]/ Encoding-undef - сразу в мусор, если есть content-type ;-) Аутлуки всегда его ставят. MP> (не проверяем мэйлер, но ловим и тех у кого encoding отсутствует) Мэйлер ОБЯЗАТЕЛЬНО проверять. Типичные рассылки, которые влипают в половину моих тестовых фильтров - это спутникмедиа: X-Mailer: одно слово, без Received:, с наличием куска хедеров от аутлука (типа X-MS-Priority и MimeOLE) и заканчивая какой-то граблёй в content-type. Было месяца два назад, может сейчас уже и нормально. -- UKR.NET Postmaster =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Thu, Aug 26, 2004 at 06:39:07PM +0300, vladimir.sharun@ukr.net wrote:
Michael Plostak wrote: MP> charset=1251 && (encoding = 7bit || undef) && subject =~ /[8bit]/
Encoding-undef - сразу в мусор, если есть content-type ;-) Аутлуки всегда его ставят.
Не надо торопиться,
MP> (не проверяем мэйлер, но ловим и тех у кого encoding отсутствует)
Мэйлер ОБЯЗАТЕЛЬНО проверять. Типичные рассылки, которые влипают
Мейлер перед этим таки да проверять , потому как вэб-мейлеры, yahoo например, не сильно утруждаются вычислением кодировки вот пример хедеров от моей знакомой, пользующейся яхой: =================== From: [skipped] <[skipped]@yahoo.com> To: bar@gu.net MIME-Version: 1.0 Content-Type: text/plain; charset=us-ascii X-SenderHostName: web14308.mail.yahoo.com ====================== При этом и тело и subj - в 1251, ни mailer , ни encoding не указывается. -- Alexey Balabushevich nic-hdl: AB433-RIPE =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Thu, Aug 26, 2004 at 06:39:07PM +0300, vladimir.sharun@ukr.net wrote:
Michael Plostak wrote: MP> charset=1251 && (encoding = 7bit || undef) && subject =~ /[8bit]/
Encoding-undef - сразу в мусор, если есть content-type ;-) Аутлуки всегда его ставят.
А остальным мэйлерам, что (при совпадении _всех_ условий выше), можно ?
MP> (не проверяем мэйлер, но ловим и тех у кого encoding отсутствует)
Мэйлер ОБЯЗАТЕЛЬНО проверять. Типичные рассылки, которые влипают в половину моих тестовых фильтров - это спутникмедиа: X-Mailer: одно слово, без Received:, с наличием куска хедеров от аутлука (типа X-MS-Priority и MimeOLE) и заканчивая какой-то граблёй в content-type. Было месяца два назад, может сейчас уже и нормально.
Я не уверен, что такой модернизм и сейчас пройдет через мои фильтры ;) И сильно сомневаюсь, что буду что-то менять до первой жалобы клиента ... Вобщем, за совет проверять дополнительно к 7bit наличие 8bit body спасибо, а насчет мэйлера я очень в большой задумчивости. Может еще кто-нибудь меня угомонит аргументированно ? :)
-- UKR.NET Postmaster
-- WBR, Michael Легенды живут, а истины умирают. =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Thu, Aug 26, 2004 at 07:04:40PM +0300, Alexey Balabushevich wrote:
On Thu, Aug 26, 2004 at 06:39:07PM +0300, vladimir.sharun@ukr.net wrote:
Michael Plostak wrote: MP> charset=1251 && (encoding = 7bit || undef) && subject =~ /[8bit]/
Encoding-undef - сразу в мусор, если есть content-type ;-) Аутлуки всегда его ставят.
Не надо торопиться,
MP> (не проверяем мэйлер, но ловим и тех у кого encoding отсутствует)
Мэйлер ОБЯЗАТЕЛЬНО проверять. Типичные рассылки, которые влипают
Мейлер перед этим таки да проверять , потому как вэб-мейлеры, yahoo например, не сильно утруждаются вычислением кодировки вот пример хедеров от моей знакомой, пользующейся яхой:
=================== From: [skipped] <[skipped]@yahoo.com> To: bar@gu.net MIME-Version: 1.0 Content-Type: text/plain; charset=us-ascii X-SenderHostName: web14308.mail.yahoo.com ======================
При этом и тело и subj - в 1251, ни mailer , ни encoding не указывается.
Яхи таки известные извращенцы, но чарсет=us-ascii не позволит сработать моему правилу у которого первый признак charset=1251.
-- Alexey Balabushevich nic-hdl: AB433-RIPE
-- WBR, Michael =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
Michael Plostak wrote: MP> On Thu, Aug 26, 2004 at 06:39:07PM +0300, vladimir.sharun@ukr.net wrote:
Michael Plostak wrote: MP>> charset=1251 && (encoding = 7bit || undef) && subject =~ /[8bit]/
Encoding-undef - сразу в мусор, если есть content-type ;-) Аутлуки всегда его ставят.
MP> А остальным мэйлерам, что (при совпадении _всех_ условий выше), можно ? Мы ведь аутлук экспресс обсуждаем ? ;-))
MP>> (не проверяем мэйлер, но ловим и тех у кого encoding отсутствует)
Мэйлер ОБЯЗАТЕЛЬНО проверять. Типичные рассылки, которые влипают в половину моих тестовых фильтров - это спутникмедиа: X-Mailer: одно слово, без Received:, с наличием куска хедеров от аутлука (типа X-MS-Priority и MimeOLE) и заканчивая какой-то граблёй в content-type. Было месяца два назад, может сейчас уже и нормально.
MP> Я не уверен, что такой модернизм и сейчас пройдет через мои фильтры ;) MP> И сильно сомневаюсь, что буду что-то менять до первой жалобы клиента ... MP> Вобщем, за совет проверять дополнительно к 7bit наличие 8bit body спасибо, MP> а насчет мэйлера я очень в большой задумчивости. Может еще кто-нибудь меня MP> угомонит аргументированно ? :) Можно привязываться к конкретным реализациям алгоритма формирования заголовков в OE [456], но ни в коем случае не одевать на всех одну шапку, будет больно. Пример sputnikmedia не первый в моей практике. -- UKR.NET Postmaster =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
On Thu, Aug 26, 2004 at 10:44:03PM +0300, vladimir.sharun@ukr.net wrote:
Michael Plostak wrote: MP> On Thu, Aug 26, 2004 at 06:39:07PM +0300, vladimir.sharun@ukr.net wrote:
Michael Plostak wrote: MP>> charset=1251 && (encoding = 7bit || undef) && subject =~ /[8bit]/
Encoding-undef - сразу в мусор, если есть content-type ;-) Аутлуки всегда его ставят.
MP> А остальным мэйлерам, что (при совпадении _всех_ условий выше), можно ?
Мы ведь аутлук экспресс обсуждаем ? ;-))
Не, начали действительно с msoe, а теперь я утверждаю, что согласно RFC1521: If the body contains data in any bit-width other than 7-bit, the appropriate bit-width Content-Transfer-Encoding token must be used (e.g., "8bit" for unencoded 8 bit wide data). при наличии charset=1251 && body =~ /[8bit]/ CTE должен быть указан и не может быть 7бит. Или я слишком вольно трактую RFC или имею полное право не принимать почту по этому критерию.
-- UKR.NET Postmaster
-- WBR, Michael Ты работа нас не бойся, мы тебя не тронем. =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
Michael Plostak wrote: MP> Не, начали действительно с msoe, а теперь я утверждаю, что согласно RFC1521: MP> If the body contains data in any bit-width other than 7-bit, the appropriate MP> bit-width Content-Transfer-Encoding token must be used (e.g., "8bit" for MP> unencoded 8 bit wide data). MP> при наличии charset=1251 && body =~ /[8bit]/ CTE должен быть указан и MP> не может быть 7бит. Или я слишком вольно трактую RFC или имею полное MP> право не принимать почту по этому критерию. Тогда первое, что начнёт фильтроваться - рассылки с info@president.gov.ua ;-)))))))) -- UKR.NET Postmaster =================================================================== uanog mailing list. To Unsubscribe: send mail to majordomo@uanog.kiev.ua with "unsubscribe uanog" in the body of the message
participants (4)
-
Alexey Balabushevich
-
Michael Plostak
-
Victor Cheburkin
-
vladimir.sharun@ukr.net