Спам атака, последствия.

Практически все сайты на LS и Alto сейчас подвергаются массированным спам атакам. Каждый защитился по своему.
Начало некоторые заметили сразу, некоторые проморгали. Я из последних, успели зарегистрироваться тысячи ботов, на одном из сайтов запощено около 15 тысяч постов. Все боты мной были забанены, большинство статей (не все пока) удалены, но в последнее время стали поступать сигналы от хостера, что очень много занимает места и сами сайты и базы данных, с превышением лимита и требуют изменения тарифа.
По этой причине у меня несколько вопросов:
1. Если я удаляю статью, удаляется ли она бесследно? Или в базе данных остаются какие то следы?
2. Если в статье были запощены фотографии или картинки, удаляются ли они при удалении статьи?
3. Забаненный пользователь остается в базе данных. После обновления версии, я смогу удалить их через админку. Тот же вопрос, что и про статью, удалятся ли боты бесследно или останется что то в базе данных?
Может у кого то есть ещё вопросы, пишите в личку добавлю апдейтом.
.

Похожие статьи

  • Не работает функия добавления топиков только админами.
    В последнее время боты одолели сайт по страшному. Пришлось переключить сайт в режим регистрации по приглпшениям. Регистрация новых ботов уже прекратилась, но их огромное количество успело зарегистрироваться (более...
  • Бесплатный плагин Antibot - отбиваем атаку спам-ботов
    Возможно, кто-то из вас заметил, что некоторое время назад на сайте стали появляться откровенные спам-топики, да еще и англоязычные. Довольно быстро они удалялись, но появлялись вновь и вновь. И когда я понял, что...
  • Боты для сайта
    Кто знает, как можно привлечь на сайт Ботов, не поисковых. Они тоже помогают раскрутить сайт и заполнить его контентом. У меня было пару хороших ботов, которые публиковали хороший контент, который даже просматривался.
  • Обновлен плагин Antibot
    С ботами плагин справляется весьма неплохо, но порой бывает чрезмерно строг и к добропорядочным гражданам. И вот это я и постарался смягчить в новой версии.

25 комментариев

+1
Насколько я помню, в таблицах базы данных типа InnoDB при удалении записи в самом файле БД остается «дырка». Соответственно, если было добавлено много записей, а потом они были удалены, то занимаемое на диске место не уменьшится. Чтобы сжать базу (избавиться от «дырок»), нужно сделать бэкап базы, саму базу удалить, а потом восстановить из бэкапа.

Картинки от удаленных статей остаются на диске
0
15 тыс постов, пусть по тысяче символов каждый, это по грубой оценке — десятки мегабайт.
0
683.99МБ
0
Это что =)
0
размер БД этого сайта, где 15К постов нашлепали боты.
Отредактирован:
0
стало быть там основная часть не спам
0
+1
С учетом тегов в этом топике более 2,5 тыс. символов. Плюс текст топика в базе в двух версиях хранится — в исходном виде, и пропущенный через Джевикс. Плюс вспомогательные поля, плюс запись заголовка и служебной информации в отдельной таблице. Но все равно в итоге получается на порядок меньше общего объема базы.

У меня есть тестовая база:
Пользователей: 2380
Блогов: 553
Топиков: 30283
Комментариев: 17262

Так она занимает 344 Mb
+2
У нас на одном сайте (сильно модифицированная ls 0.5.2) какой то самописный модуль, при регистрации задается простой вопрос-загадка, а юзеру нужно ответить в текстовом поле. Вопросы/ответы хранятся в xml файле и периодически меняем. Так же стоит ограничение на 3 поста в день для новорегов. Спам если и бывает (пару постов в неделю) модераторы сразу же удаляют.

Мне всегда было интересно, почему вебмастера не пользуются такой простой, но эффективной системой защиты от спама, которая отлично работает на любом движке?
+1
Вот специально для подобных вещей в 1.1 капчу и переделали, чтоб легко и просто можно было ее заменять на свою, в т.ч. и с вопросами, картинками и проч.
0
Мне всегда было интересно, почему вебмастера не пользуются такой простой, но эффективной системой защиты от спама, которая отлично работает на любом движке?
Может потому что она не эффективная? Хотя если речь об ограничении в 3 поста в день, то да конечно. У меня есть вариант лучше — вообще запретить пока юзер скан паспорта не пришлет.
Отредактирован:
+1
Может потому что она не эффективная?

У нас отлично работает уже последние года 3 — посещаемость на данный момент около 20000 хостов в сутки, новых регистраций в день ~100, спама практически нет. Во всяком случае нет тысяч спамных топиков.

Хотя если речь об ограничении в 3 поста в день, то да конечно. У меня есть вариант лучше — вообще запретить пока юзер скан паспорта не пришлет.

Это каждый для себя сам решает. Мы для себя решили, что новорег, который хочет добавить больше трех постов в сутки — спамер. Ну а вы можете требовать паспорт или тест днк, в зависимости от фантазии (=
0
Ну а вы можете требовать паспорт или тест днк, в зависимости от фантазии (=

+100500
0
Это каждый для себя сам решает. Мы для себя решили, что новорег, который хочет добавить больше трех постов в сутки — спамер. Ну а вы можете требовать паспорт или тест днк, в зависимости от фантазии (=

Вы отсеиваете юзеров а не ботов. Какие еще 3 поста в день? Это что мало боту? Они зарегистрируют столько сколько им нужно (если ваш сайт будет инетерсен).
0
Конечно всегда есть вероятность, что найдется человек который будет сутками вручную регить новые акки и постить с них с помощью ботов по 3 поста в день с каждого =) Но зачем?

Вообще при активном сообществе и 200+ пользователей онлайн, они сами решают какие топики стоит удалить, с помощью голосования. В этом как мне кажется и есть смысл веб 2,0 — самомодерируемое сообщество. Для спорных вопросов есть модераторы, но их вмешательство минимально.

Ну а частные случаи с ручной регистрацией ботов, чтобы запостить 3 поста и быть забаненным, думаю нет смысла рассматривать.
0
Конечно всегда есть вероятность, что найдется человек который будет сутками вручную регить новые акки и постить с них с помощью ботов по 3 поста в день с каждого =) Но зачем?
Боты не люди =) Скриптам по барабану. Боты не пользуются браузерами, не сохраняют куки, не регят почту на гмейле. Единственная причина что у вас не было серьезных атак видимо в том, что у вас загадки на сайте на русском. А абсолютное большинство атак идет из англоговорящего сегмента, а китайцы продающие услуги по подбору капчи, тоже не очень сильны в языках. Или машинный перевод не спасает.
Отредактирован:
0
А вы угадали =) Загадки очевидны для русскоязычного человека и бесполезны для машины или иностранца. К тому же база периодически меняется и пополняется.
0
а можно подробнее? что за атаки, на чем основаны(почему именно LS/Alto?).
с друпалом недавно намучался с этими уязвимостями :( чего про LS/Alto в этом смысле мне следует знать? :)

спасибо!
0
Про другие движки я просто не знаю, может и там есть.
+2
На самом деле не только ЛС/Альто, а многопользовательские сайты, т.е. где юзеры могут самостоятельно зарегистрироваться, подтвердить регистрацию мылом и сразу начать постить. Мне про подобное рассказывали владельцы сайтов на Друпале и Джумле, где была открытая регистрация.

Явных уязвимостей у Альто в этом плане не обнаружено. Я смотрел серверные логи, и там видно, что регистрации бывают двух видов:

1) Идет тупо программная попытка подбора капчи. Возможно, на том конце даже какая-то система распознавания работает, но не очень хорошая, т.к. много ошибочных результатов. «Долбежка» может идти весьма основательная, иногда — несколько сотен попыток регистрации в час, с разных IP, с разными сессиями. И часть из них прорывается.

2) Иногда регистрации явно вручную идут — капча вводится с первой попытки, время между запросом страницы и отправкой формы довольно большое. А потом, видимо, рег. данные уже в базу вносят, и бот авторизуется и постит топики.

На этом сайте тоже было такое, специальный плагин пришлось писать: altocms.ru/859.html
0
Спасибо!

А потом, видимо, рег. данные уже в базу вносят, и бот авторизуется и постит топики.

это да — это будет всегда :( разве что :) модуль статсов, предложенный как часть разделеня в ветке про рейтинги, тут вполне бы пригодился — можно уже с таймаутами как то играться и пресекать подозрительную активность даже зарегатых.
+1
А потом, видимо, рег. данные уже в базу вносят, и бот авторизуется и постит топики.
Самый эффективный способ борьбы с таким спамом — ограничивать для пользователей с регистрацией меньше месяца лимит на постинг в день.

плагин пришлось писать: altocms.ru/859.html
Этот плагин не пускает очень много «живых» пользователей, в частности с tora посетители впринципе не могут авторизоваться. Да и некоторые ip сети — для сайтов с высокой посещаемостью, этот плагин вообще не вариант.
+1
Самый эффективный способ борьбы с таким спамом — ограничивать для пользователей с регистрацией меньше месяца лимит на постинг в день
Не, этого мало. У меня, как правило, боты не больше двух постов писали (возможно, больше просто не успевали :)

Думаю, более эффективно — это премодерация топиков с ссылками для юзеров-юниоров (либо по дате регистрации, либо рейтингу). В подавляющем числе случаев в спам-топиках есть ссылки.

Но тут есть еще один нюанс — если даже боты эффективно отсеиваются на странице регистрации, то сами их попытки могут создавать нехилую нагрузку на слабенький хост, т.к. каждый их запрос — это полный цикл отработки движка.
+1
Не, этого мало. У меня, как правило, боты не больше двух постов писали (возможно, больше просто не успевали :)

Кстати пользователи сайта могут самостоятельно удалять такие посты — набрав определенное количество минусов пост удаляется без участия модератора ) При таком подходе 15000 постов спамер уже не создаст, как у автора топика.

Но тут есть еще один нюанс — если даже боты эффективно отсеиваются на странице регистрации, то сами их попытки могут создавать нехилую нагрузку на слабенький хост, т.к. каждый их запрос — это полный цикл отработки движка.

Честно говоря не скажу как у нас это реализовано, возможно первым проверяется поле на правильный ответ, во всяком случае если это не ddos, особых проблем не возникало ) Но у нас выделенный сервер, а для проектов с небольшой посещаемостью, наверное плагин altocms.ru/859.html действительно решение…
+1
Этот плагин не пускает очень много «живых» пользователей, в частности с tora посетители впринципе не могут авторизоваться. Да и некоторые ip сети — для сайтов с высокой посещаемостью, этот плагин вообще не вариант.
Надо настраивать чтобы только при регистрации сверялся с базой и не хранил черный список. Если что юзер напишет на почту (можно кастомизировать сообщение которое будет выводиться) и вручную внести в белый список его IP.
Плагин отличный, Вадиму большое спасибо.
Отредактирован:
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.