Ошибочный трафик

Lasto's Abductor, Похититель буковок Lasto's Abductor, Похититель буковок

Ошибочный трафик.

В идеально свёрстанном сайте никакого ошибочного трафика быть не должно. Так как если нет страниц с "кривыми" внутренними ссылками, то нет и заблудших серферов и ботов, натыкающихся на страницу ошибки доступа.

В реальной же жизни ошибочный трафик есть всегда:

  1. Документ, который Вы удалили или переместили (по дате или между разделами сайта), URL которого успел подсмотреть бот поисковика, навсегда останется в памяти искалки. И искалка будет периодически проверять давно умерший URL, в соответствии с христианскими традициями. Вдруг случится чудо, и он воскреснет?

    И это несмотря на то, что в любом неживом URL-е отдается хедер 404 ошибки. И бот, по идее, не должен туда долбиться - есть же соответствующая спецификация.

  2. Если админ, путешествуя во внутренностях админки, будет настолько глуп, что обвешает свой браузер всякими панельками со встроенными шпионами (все панельки этими шпионами штатно оборудованы, ибо в том и состоит смысл наличия в природе такой панельки), то посещённые админом URL-ы будут незамедлительно переданы производителю панелек. В том случае, если хозяин панельки Гугл или Яндекс, спустя короткое время индексирующий бот соответствующей искалки начнёт долбиться в адреса внутренней зоны админки.

    Поскольку не авторизованному посетителю доступ в такие URL-ы закрыт, тут же возникает ошибочный трафик.

  3. В интернете навалом сервисов проверки сайтов на что угодно - на тип CMS, к примеру. Это означает, что подобные сервисы будут посещать URL-ы, типичные для примерно пятидесяти различных движков, и анализировать то, что видно в таких URL-ах.

    Это вызовет массу хитов в никуда.
    С соответствующим логом ошибочного трафика.

  4. Ещё больше в интернете разного рода хакеров, мечтающих через ту или иную уязвимость конкретного движка подсадить в Ваш сайт свой код, позволяющий этот сайт поломать. Не из детской шалости, а ради засовывания внутрь дора, клоакера, или чего-нибудь ещё более затейливого.

    Хакерские боты действуют примерно так же, как и сервисы из пункта выше.
    С теми же последствиями.
    Узнайте больше: О глистах на сайте.

  5. Простые некорректные запросы к "кривым" URL-ам.
    Причина кривизны URL-ов может быть какой угодно.

    Например, Вы поменяли тайтл статьи.
    Используя при этом ЧПУ с тайтлом статьи в адресе.
    Понятно, что URL статьи при этом изменится.

    Либо какой-то бот (которых сотни) не понял ЧПУ Вашего сайта, и исказил ссылки. В итоге в логе ошибочного трафика Вы наблюдаете массу совершенно уродских URL-ов, посещаемых с определённого айпишника с неведомой целью.

  6. Ну и простая кривизна ссылок с внешних ресурсов.

    Чем более затейливое ЧПУ Вы установите, чем больше туда напихаете всякой кириллицы, тем больше шансов, что такие URL-ы, вносимые в статьи через админки разнообразных Вордпрессов, будут искажены - плагины превращения внешних ссылок во внутренние, с последующим редиректом, могут давать на выходе просто эпический фейл. А вебмастера с Вордпрессами в руках крайне любят такие плагины ставить, редко когда их тестируя на вменяемость.

Этот список можно продолжать, но суть Вы уже поняли.

Посещайте лог в кнопке админки "Ошибочный трафик за месяц", и, если видите там какое-то хакерство, смело заносите айпишник этого бота в Жёсткий Бан, в табличку с айпишниками.

Убедитесь только сперва, что это не полезный бот.

Иллюстрация к пункту 3: тест на признаки CMS.

IP:178.210.65.38
date:02.03.13 02:07:00
agent:Mozilla/5.0
from:---
to:/bitrix/admin/
to:/user/login/
to:/node/
to:/user/password/
to:/manager/
to:/netcat/admin/
to:/users/forget/
to:/users/registrate/
to:/admin/content/sitetree/
to:/wp-admin/
to:/wp-content/

Иллюстрация к пункту 5: глупый корейский бот.

IP:14.63.227.33
date:02.03.13 04:53:47
agent:¤Java/1.6.0 04
from:---
to:/http%3A%2F%2Fabductor.ru%2Fabout.html
to:/http%3A%2F%2Fabductor.ru%2Fconnect.html
to:/http%3A%2F%2Fabductor.ru%2Findex.html