Настройки парсера.

Lasto's Abductor, Похититель буковок Lasto's Abductor, Похититель буковок

Настройки парсера.

Парсер работает в специальном URL-е
http://abductor.ru/parser_work.html
где вместо выделенного красным можно указать свой компонент URL-a.
Настоятельно рекомендуется так и сделать.
Период поиска новых статей. В часах:
Не стремитесь искать новые статьи часто!

Прокси:

Способ коннекта к донору:

Если выше выбран cURL, то:

Список прокси, по одному на строку.
Формат: xxx.xxx.xxx.xxx:port=
Если прокси приватный, то после знака равенства укажите авторизацию.
Формат: xxx.xxx.xxx.xxx:port=login:password

Правила поиска статей на донорских ресурсах:

Настройки не для постоянной правки, поэтому инструкция снаружи.
Там же есть дефолтовое содержимое формы, если тут Вы чего-нибудь испортите.

Правила наполнения разделов:

Правила извлечения URL-ов статей из поисковиков и произвольных сайтов, также имеющих сниппетную организацию, сформулированы выше. Здесь определяется то, как именно будут применяться те или иные правила, причём индивидуально для каждого раздела.

Формат записи: [rule][keyword][pages]=

Все элементы обязательны:

  1. rule - имя правила парсинга HTML страниц.
    Нпример, google.ru
    То есть первый элемент [a] из предыдущего раздела.

  2. keyword - поисковый запрос, если Вы парсите искалку.
    Либо ноль, если парсится не поисковая система.
    Синтаксис поисковых запросов полностью поддерживается.
    Вы вправе писать сюда нечто сложное, например (для Гугла):

    inurl:.ru +"Анджелина"+ "Джоли"

  3. pages - страница или список страниц серпа.
    Либо ноль, если парсится не поисковая система.

    Страницы серпа могут перечисляться через запятую, или тире.
    Примеры:

    1 - обработать только первую страницу серпа.
    1,2,5 - 1,2 и 5 страницы.
    3-7 страницы с 3 по 7.
    1,2,5-10 - 1,2, и с 5 по 10

Пример полной записи: [google.ru][inurl:.ru +"Анджелина"+ "Джоли"][1,4-5]=

Также можно брать ссылки на статьи с RSS лент.


Формат записи: N=URL

Где:

  1. N - число, уникальное для каждой записи.
    Или какой-то краткий комментарий, не содержащий знака "равно".

  2. URL - абсолютный URL любой RSS ленты.
    Причём именно RSS ленты, а не чего-либо иного.

Пример (запись делается строго в одну строчку, без переносов):
1=http://habrahabr.ru/rss/hubs/

Раздел "Парсинг контента"

Раздел "Сателлиты, всё о них"

Раздел "Дорвеи"

Раздел "SEO - хочется трафика"