Скрипты и программы BatchURLScraper - Извлечение данных методами XPath, CSSPath, XQuery и RegExp

Всем привет!

Представляю вашему вниманию бесплатную программу BatchURLScraper, предназначенную для извлечения данных со страниц сайтов используя XPath, CSS-селекторы, XQuery и RegExp.

buscr.png


buscr-scrape-rules.png


buscr-debug.png


Возможности программы BatchURLScraper:
  • парсинг и извлечение данных по списку URL
  • гибкая настройка парсинга используя XPath, CSSPath, XQuery и RegExp
  • модуль для тестирования правил парсинга
  • экспорт отчетов в Excel (CSV-формат)

Страница скачивания (5 Мб): BatchURLScraper - XPath, CSSPath, XQuery, RegExp парсинг и извлечение данных с сайтов

Буду рад любым отзывам и пожеланиям по работе программы.
 


Рекламное сообщение
Octo Browser — антидетект браузер, подходящий для любого вида маркетинга: арбитраж трафика, партнерский маркетинг, веб-скрейпинг, SMM, ORM и многое другое.

Преимущества нашего браузера:

✅ Подмены выполняются на уровне браузерного ядра — максимальная защита от идентификации устройства
✅ Высокие показатели стабильности работы — аптайм составляет 99,995%
✅ Оперативное обновление ядра до актуальных версий
✅ Пользовательские данные хранятся на европейских облачных серверах и зашифрованы по стандарту AES
✅ Возможность экспорта профилей в файл, который можно передавать другому пользователю браузера
✅ Безошибочно проходит проверки Pixelscan, BrowserLeaks, CreepJS

4 дня пробной подписки BASE по промокоду: PIRATEHUB

➡️ Подробнее о сервисе
 

Новая версия BatchURLScraper 1.3

get-ga.png


get-templates-counter.png


buscr-settings.png


Что нового:
  • расширено число страниц для парсинга с 1000 до 5000 URL
  • добавлена возможность скрапинга через HTML templates
  • добавлена возможность извлечения данных через атрибуты CSS
  • добавлена возможность скрапинга через внешний и внутренний HTML
  • добавлена возможность использования списков Proxy
  • исправлен баг некорректного сохранения User-Agent

Страница скачивания: BatchURLScraper - XPath, CSSPath, XQuery, RegExp парсинг и извлечение данных с сайтов
 

Обратите внимание

Назад
Сверху