02.01.2020
  1 Replies
  1.7K Visits
Как вытянуть тексты страниц с помощью Screaming Frog
около 5 лет назад
·
#174
Автоматизировать процесс парсинга текстов с помощью Screaming Frog можно с помощью выражений Xpath.

Xpath — это язык запросов к элементам xml или xhtml документа. Для того, чтобы пользоваться данным языком запросов не обязательно быть программистом


Необходимо:

1️) Составить список страниц, в которых необходимо выгрузить текст.

2️) На одной из страниц скопировать Xpath для элемента статьи. Например, для того, чтобы найти соответствующий Xpath на выбранной странице нажимаем Ctrl+Shift+I, копируем Xpath нужного элемента для парсинга: правая кнопка мыши → Copy → Copy XPath

3️) Далее настраиваем лягушку:


  • Переключаемся в режим списка (меню Mode → List)

  • Переходим в меню Configuration → Custom → Extraction, выбираем XPath и Extract Text и вставляем скопированный код скопированный код XPath


4️) Запускаем парсинг по списку URL-ов.

В соответствующем столбце спарсится нужный текст
  • Страница :
  • 1
На это сообщение еще не было создано никаких ответов.
Будьте первым, кто ответит на него.
Ваш ответ
Загрузите файлы или изображения для данного обсуждения, нажав на кнопку Загрузить. Поддерживает до gif,jpg,png,jpeg,zip,rar,pdf
· Инстаграм · Удалить
  Upload Files (Maximum 2MB)
Капча
Прежде чем Ваш вопрос будет опубликован, для защиты нашего веб-сайта от роботов и неавторизованных скриптов мы требуем, чтобы Вы ввели ниже код кептчи.