Предотвращение граббинга новостей
17 04 2007Для ведения сплогов, как правило, настраивают RSS ридеры, и они транслируют на сплог 3 - 10 лент, таким образом сплог постоянно растёт, и делать ничего не надо. Это левый метод (хрень собирается), но … это лучше чем наполнять блог генерённым текстом плохого качества.
Давайте подумаем как можно этому препятствовать.
Народ тырит RSS ленты => нужно отключить RSS и тырить будет нечего. Парсеры заточены именно под RSS или Atom и лазить по сайту в поисках постов никто не будет, тут важен поток.
Минус - честные пользователи не смогут читать ваши посты в лентах. Потому такой способ плох, удобство клиента - прежде всего.
Можно выводить в RSS только отрывок, таким образом, если народ тырит ваш контент, то им будут доставаться только тайтлы и шапки. Полностью - же статья будет только у вас.
Это более правильное решение, но некоторые RSS грабилки ходят по линкам, и с помощью регулярных выражений считывают полный текст поста.
Как этому можно помешать? Достаточно просто. Введите в шаблон псевдо - ненужные, но важные для оформления структуры. Переписывать грабилку для вас никто не будет, спамер просто выкинет ваш ресурс из базы сбора контента, и добавит туда 10 других.
Например вводим в теле шаблона открытие таблицы, дива и ещё что - то, а в постах пишем их закрытие. Это глупый пример, показывает лишь суть. Меняя набор тегов вы сделаете чрезвычайно сложным разбор страницы выражениями.
Мир вам, да любовь ![]()



