Парсер Avito

Фев. 27, 2014 @ Обзоры софта
Парсер Avito

Итак, сегодня проведу обзор свеженаписанного парсера объявлений Avito.

Основные особенности таковы - мнопоточность, поддержка прокси, интегрированный движок js, распознавание изображений, это для телефонов, экспорт в текстовый файл и html, шаблоны экспорта на базе jinja, ну и скачивание изображений.

Теперь по порядку.

Настройки

Все вполне очевидно, разве что уточню, путь для изображений указывается относительно файла экспорта.

Шаблоны экспорта

Поддерживается два типа шаблонов на базе движка jinja, текст и html. Хотя указав разметку, к примеру, wordpress xml, вместо html, можно выгрузить и в WP.

Сбор объявлений

Сбор объявлений происходит многопоточно, по ссылкам указанным в окне запроса. Сразу уточню, если парсите более сотни объявлений, используйте проверенные прокси. Иначе получите либо малый процент годных объявлений, либо бан от Авито.

Просмотр результатов

Вот так выглядит главное окно после выполнения сбора информации.


Экспорт

Выбираем файл и формат экспорта и voila, у нас на выходе файл такого вида


Каталог изображений


А в браузере это выглядит следующим образом

Вот, примерно так выглядит работа с парсером. Заказать парсер Avito можно в разделе продуктов. До новых встреч.

Похожие статьи

blog comments powered by Disqus