Screaming Frog может находить не только дубли страниц, но и похожие (неявные дубли). Происходит это следующим образом.
— Переходим в настройки «Configuration» - «Content» - «Duplicates» и настраиваем процент пороговой схожести контента. Смотрим картинку - 1
— Далее в настройках «Configuration» - «Content» - «Area» задаем исключения и правила для анализа контента, задавая теги, классы и идентификаторы. Смотрим картинку - 2
— Парсим сайт. После окончания парса настраиваем данные для анализа парса «Crawl Analysis» - «Configure».
Смотрим картинку - 3
— Шаг 4. Выполняем анализ: «Crawl Analysis» - «Start».
— После чего во вкладке «Content», выбрав из списка «Near Duplicates» можно увидеть страницы с похожим контентом. Смотрим картинку - 4