Коментарен спам

Надали има автор на блог, който да не се е запознал с явлението “коментарен спам”. И да не мисли как да си реши проблема с него. В това число и аз.

Повечето хора разчитат на технически средства, които най-често имат и недостатъци. Прочутото capcha (показване на картинка с текст на нея, който да бъде въведен) например е доста популярно напоследък. Тези, които го слагат, обаче сблъскват читателите си с неудобство – а някои от тях, примерно незрящите, и с невъзможност да коментират. Повечето други технически решения също имат подобни недостатъци.

Аз предпочитам да действам чрез “правилна методология”. Принципът е прост: толерантността към спама е нулева, решенията по въпроса – окончателни. Сайт, който е бил рекламиран чрез спам, дори веднъж, минава при мен през следната процедура:

– всякакви блог-коментари, които го споменават, биват автоматично изтривани
– всякакви съобщения от или за него биват автоматично изтривани
– всякакъв трафик от или към него бива блокиран (а ако хвана провайдер, дал връзка на повече от един спамер едновременно, и не ги блокирал ВЕДНАГА – целият провайдер)

Изключения не правя. Протестиращите пращам при арменския поп.

Ако спамер декларира пред мен, в официален писмен документ (на хартия, нотариално заверен), че се отказва завинаги от това средство за реклама, мога да преразгледам решението си. Ако сметна за необходимо. Ако не спази декларацията си, връщам обратно мярката окончателно.

Преразглеждам решението си и ако се окаже, че спам е пускан от нечие име, за да го блокира светът. Но искам убедителни доказателства.

(И аз веднъж, в началото на фирмата си, направих глупостта да пусна спам. След което взех за себе си решение-еквивалент на горната писмена декларация. Така че смятам, че имам моралното право да го правя.)

Въпросната методология ми харесва, защото реално на практика се бори със спама. Кандидат-спамерите имат реален, а не морален стимул да преразгледат решението си, преди да са го изпълнили. Пръскачите на спам (и техните провайдери) имат реален, а не морален стимул да преразгледат политиката си. Ако значим процент системни администратори постъпваха така, спамът щеше да е на изчезване.

Та, този път реших да създам някое дребно удобство на тези, които се борят с коментарния спам.

В http://ftp.serdica.org/antispam/blog-comment/ съм сложил два обикновени текстови файла – spamwords.txt и spamsites.txt.

Първият съдържа думи и словосъчетания, по едно на ред, които съм срещал в коментарен спам, и НЕ са имена на рекламираните сайтове. (Обикновено предпочитам да вадя сайтовете; понякога обаче те или имат купища регистрирани имена, или начинът за контакт не е уеб-адрес.)

Вторият съдържа имена на сайтове, или елементи от тях. (Някой път ще го изредактирам, и ще го допълня до точни имена на зони и домейни.)

Поставянето на съдържанието им в blacklist-а на коментарите на блога води до далеч по-малко спам за ръчно пресяване. (А добавянето им във всички други blacklist-ове, които имате, според мен води и до мъничко повече справедливост и ред из Мрежата. 🙂 )

От време на време, когато се сетя, ще ги допълвам. Ако имате какво да добавите към тях, е добре дошло – пращайте ми го по пощата. Е-майл адресът ми е grigor, в този домейн.

Уфф… А бях обещал да направя достъпни колекции спам, с които човек да може да си тренира bayesian-антиспам програмите… Дано да се сетя до седмица-две да придвижа и този въпрос.

2 thoughts on “Коментарен спам

  1. пейо

    Засега проверката за наличие на символ на кирилица върши повече от отлична работа. А иначе такива бази с “лоши думи” се събират на няколко места из WP общността.

    Reply
  2. Григор Post author

    При мен има немалко коментари и само на латиница, които не са спам… А иначе, повече такива бази – по-добре. 🙂 Така и така я събирам за себе си – защо да не я споделя и за другите?

    Reply

Leave a Reply

Your email address will not be published. Required fields are marked *