Паразитный трафик и Nano-CMS.

О паразитном трафике.

Спустя некоторое время после запуска Любопытствующей Наны Вы обнаружите, что на Ваш сайт есть переходы с других сайтов, причём при визите туда ссылок на Вас почему-то не видно. Опытный вебмастер уже знает, что это такое, а начинающему нужны пояснения.

Зовётся это явление рефспамом.
Ответственны за него вот такие персоналии:

  1. Владельцы сервисов для вебмастеров.
    А также партнёрских программ, интересных вебмастерам.

    Смысл прост - любой толковый вебмастер всегда периодически просматривает логи своего сайта, и обязательно проявляет интерес к сайтам, на него ссылающимся. Минимально вебмастер посетит такой сайт, и посмотрит, а что же там, собственно.

    Если этот сайт чем-то вебмастеру потенциально полезен, он не останется без внимания. Соответственно, в данном случае рефспам играет роль пассивной рекламы, и может быть ассоциирован с объявлением на столбе. Кто-то да прочтёт.

  2. Так называемые "раскрутчики сайтов".

    Идея явления тоже проста. Генерируя хиты на Ваш сайт, и подставляя источником хитов какой-то домен, "раскрутчик" ожидает, что у Вашего сайта может оказаться незакрытая от просмотра статистика, доступ к которой имеют и индексирующие боты поисковых систем. Они увидят ссылку на продвигаемый домен, и как-то её зачтут ему в карму. Мол, стоят же на домен внешние ссылки, это ж здорово.

    То, что в действительности на Вашем сайте никакой такой открытой статистики нет, этих "раскрутчиков" не интересует. Они Ваш сайт даже и не видели. А тупо спарсили выдачу поисковика по какой-то тематике, либо вообще купили готовую базу доменов.

    То есть это действия наобум.

Понятно, что вебмастеру не очень интересно наблюдать в статистике десятки или даже сотни фиктивно линкующихся на него сайтов со всевозможной порнухой или дорвеями (только такое гуано обычно и продвигается через рефспам). Было бы логично всё это гуано сразу загонять в резервацию, и без тщательного отслеживания, откуда оно и куда именно якобы ссылается. Дабы не тратить впустую ресурсы.

Тут есть два варианта.

Рефспам с морд.

Это простейший, «наивный» метод рефспама.
Когда источником трафика подставляется морда внешнего сайта.

Но все мы прекрасно понимаем, что никто и никогда не ставит ссылок с морды сайта, так как такие ссылки дорогого стоят. Поэтому, если мы видим, что к нам пришёл хит с морды чужого сайта, мы можем быть почти уверены, что это подделка. Такой хит можно не учитывать, полагая его фейковым.

Именно с этой целью в настройках статмодуля файла ./data/settings.php есть строка:

   'ignor' => true,  # true - игнорировать попингуев,  false - нет.

Она призвана весь такой «наивный» рефспам детектировать, и свести в отдельную табличку на морде Любопытствующей Наны. Tабличка полезна тем, что позволяет увидеть самых настырных рефспамеров, и забанить их, если ими создаётся слишком уж много паразитного трафика (сотни хитов в сутки). Достаточно кликнуть в строчку спамящегося домена, и нажать там соответствующую кнопку.

Если же указанную строчку видоизменить на

   'ignor' => false# true - игнорировать попингуев,  false - нет.

то никакой резервации не образуется, и всякий сайт опрашивается на предмет того, откуда и куда он ставит ссылку. Всё равно, есть такая ссылка в реальности, либо она поддельная (фиктивная).

Само собой, рекомендуется первый вариант.
Резервация для рефспамеров весьма полезна.

Рефспам с внутренних документов.

Его по формальным признаком уже не отличить от обычных переходов между сайтами по ссылкам. Поэтому придётся либо изобретать проверку кода ссылающейся страницы внешнего сайта (парсинг), либо как-то иначе верифицировать входящий хит.

Парсить чужие сайты без спросу не очень правильно (кто нам дал такое право?), а вот проверить входящий хит на «человечность» никто не запрещает. Это можно сделать с минимальными затратами сил и средств: в документе нашего сайта при первом визите с неизвестного ранее внешнего документа вместо контента мы показываем страницу-прокладку, с которой собственно контент доступен по кнопке. Кнопка реагирует только на живого человека.

Если такой тест пройден успешно, URL внешнего документа запоминается, и больше при хите оттуда страница-прокладка не показывается. А сам хит попадает в статистику.

А вот если тест не пройден, хит признаётся фейковым, и в статистику не заносится. Соответственно, никаких рефспамеров Вы в статистике не видите, и они Вас больше не раздражают.

Подобный тестировщик обозван Антипопингуйным Полицаем (исторически так сложилось), и в файле настроек ./data/settings.php включается так:

      'popingues' => true,             # true - есть антипопингуйный полицай, false - нет.

Он работает с любым трафиком, исходящим (или якобы исходящим) не только с внутренних документов ссылающихся сайтов, но и с их морд.

Интерфейс страницы-прокладки.

Обратите внимание, что файл ./data/content/_stats.php своим шаблоном оговаривает, что именно будет написано на странице-прокладке, и Вы можете этот текст менять, как хотите:

<h2>Внимание!</h2>
<
p>Вы переходите с сайта <strong>===from===</strongна <strong>===to===</strong></p>
<
p>Настоящим уведомляетсячто эти два сайта не связаны никакими обязательствами.
<
br>Пожалуйстаподтвердите своё намерение перехода нажатием кнопки ниже:</p>

Сама страница-прокладка лишена интерфейса Наны, и её дизайн настраивается там же. Не рекомендуется делать иначе, так как на странице-прокладке в принципе не должно быть никаких ссылок, кроме единственной кнопки, которую пользователь и должен нажать. Насуёте в документ всяких ссылок и кнопок, и он не сможет выполнить своё предназначение.