Парсинг сайтов объявлений
Добрый день!
Нужен парсер для сайта объявлений (сбор заголовков, текста, телефонов, емейлов). Региональность — Россия, Украина, Казахстан, Беларусь, язык русский.
После парсинга данные нужно проанализировать на предмет наличия ключевых слов и сформировать список тегов к каждому объявлению в соответствии с ключевыми словами.
По итогам сбора выбрать наиболее длинные по количеству символов объявления и записать их во внешнюю БД.
Данные собираются с двух (трех — если можно обойти Google Captcha) сайтов. БД для сбора/записи PostgreSQL.
Важное замечание: сбор предполагает данные для взрослых (знакомства, категория 18+), поэтому широкий кругозор и толерантность исполнителя являются таким же важным фактором как и опыт парсинга данных.