Напоследък повечето уикита, които хоствам, са под силен удар на спамботове.
Такива удари не са новост: спамботовете редовно ги пълнят с несъществуващ боклук, за да задръстват блеклистинг системите. Този път обаче пуснатите линкове са истински.
Разширението SpamBlacklist не помага – очевидно проектите на фондация Уикимедия са избягнати. Големият брой следящи ботове там моментално вписва спамвертизираните URL-и в локалния черен списък, който се проверява от почти всяко МедияУики по света. Вероятно ботмрежата е програмирана умишлено да не ги закача, за да може да останат боклуците й в други уикита колкото се може по-дълго.
Принципно подобни атаки не ме тревожат – отдавна съм си написал модулче за МедияУики бота ми, което чисти спам-ревизиите. Десетки пъти е чистило хостнатите при мен уикита от боклука. (Ако ползва администраторска сметка, не само връща отново не-спамовите ревизии, но и може да изтрива страници, които са създадени от спамботовете, и да блокира спамерските сметки и адреси.) Ако някой има нужда уикито му да бъде почистено от спама, ще му направя услугата с удоволствие.
Този път обаче спамботовете бяха нахитрели значително. Вместо да изхвърлят целия или почти целия оригинален текст, те доста често само вмъкват някъде из него едно-две линкчета. При по-големи статии това успяваше да измами алгоритмите за проверка, и да даде спам коефициент под граничния. Наложи ми се да допиша проверка и на разликите между ревизиите. Още доизпипвам коефициентите й за различните подозрителни явления, но като цяло вече върши работа.
… Засега успяваме да сборим спамерите. 🙂
Само да вметна…
…сметка == акаунт/профил, нали?
Просто звучи странно и нелогично… По едно време Google се опитаха да въведат термна “сметка” — примерно, “излезте от вашата Google сметка” (вместо “излезте от вашия Google профил (или акаунт)”… но всеки усеща, колко глупаво и нелогично звучи този термин така преведен на български…
Не съм сигурен и че “акаунт” или “профил” е толкова по-добър термин от “сметка”, но със сигурност, в онова значение, за което ти говориш, “сметка” е много неподходящ термин. (А може и да греша…)
Just my $0.02 🙂
@Michel: В Уикипедия се е наложило така, и го използвах, без да се замисля 🙂
еми то тая борба е безкрайна. Радвам се, че си получил временно надмощие 🙂
Интересно ми е защо спамерите изобщо се занимават с това, защото писането на спамботове и непрекъснатото им ъпдейтване за да се справят със своите ‘анти-‘ си е сериозен труд (не че съм го правил, но съм правил неща които сигурно са подобни по фукционалност). От заниманията ми със СЕО съм стигнал до извода, че линковете в уикита са с почти нулева ‘възвръщаемост’. А да се разчита човек да прочете спама и да последва линк е просто глупост. Т.е. целта на занятието ми се губи. Може би е Лениновия (ако правилно си спомням авторството) принцип, че количествените натрупвания все някога ще доведат до качествени изменения 🙂
@Пешо: Идиотите са опасни за околните – не казвам нищо ново. Винаги се намира, един на хиляда или сто хиляди, идиот. Който като прочете “викодин”, “лесбийки” или каквото там му е чувствителната точка, цъка на линка, ако ще до него да стои стражар, който да го бие с чук през пръстите за всяко цъкане. Пръснат ли ботмастерите ли спама си на един милион места, се намират десет, сто или хиляда идиоти. Всеки от тях означава:
– петдесетина долара печалба от продадения му боклук
– още един (често и повече от един) компютър към ботмрежата, заради лепнатия му троянец
– още средно по десетина долара (в повечето случаи нула, но в някои по няколко хиляди) от изпразнените му банкови сметки
– още средно по пет-десет долара от откраднати акаунти за онлайн игри (стават за продаване на игромани и за куп други неща)
– още средно по пет-десет долара от откраднати акаунти за социални мрежи (стават за търсене на още наивници и пръскане на още спам)
– още средно по пет-десет долара от продаване на личната информация на информатори на домашни и улични обирджии
– още средно по пет-десет долара от продаване на личната информация на финансови пирамиди и подобни мошеници
– още средно по няколко точки неуязвимост срещу преследване, от продаване на личните данни на разузнавания
Тоест, към по стотина долара от идиот (вероятно има и още начини, които не се сещам в момента). Което значи при успешна акция и до стотина хиляди долара. Акции могат да се правят по няколко на ден – това прави поне по десетина милиона на месец, ако имаш добри агенти за поръчки за спам и за продаване на откраднатите акаунти и лична информация. Стига и за дописване на ботовете, и за какво ли не. Не е лошо, а?
значи Ленин е бил прав 🙂
Всъщност нищо чудно, той с пълно основание би могъл да се разглежда като спамер – пробутал е непоискани неща на милиони.
По принцип си прав и знам, че от тоя тип дейност се изкарват големи пари. Просто изразих учудване, че се прави през уики-та, защото тоя начин е сравнително сложен и с много по-ниска успеваемост от други далеч по-прости начини.
@Пешо: Защото другите далеч по-прости начини отдавна вече също се правят. 🙂
@Григор:
О, да, видях видях… Съвсем прав си! “Регистриране на сметка”, в wikipedia|bg? Лоша работа…
Може и да няма по-добър превод, ама личното ми мнение е, че “сметка” звучи глупаво в такъв контекст… [/end offtopic] 🙂
ReCaptcha би трябвало по-лесно да свърши работата?
http://code.google.com/apis/recaptcha/docs/mediawiki.html
А едно време имаше сериозно лекарство за спамерите — трафика на електронната поща се плащаше 🙂
@Вергил Пенков: Съмнявам се. Като минимум, в Индия хиляда правилно решени капчи струват между 20 и 50 долара. А като продължение, порно-капча-солверите нищо не струват…
@Даниел Калчев: И как точно помагаше то срещу уики-спам от ботмрежи?