Техническое Задание на Разработку Парсера для Сбора Контактных Данных Отелей
Цель: Разработать парсер для автоматизированного сбора адресов электронной почты отелей с сайта Booking.com, удовлетворяющих указанным критериям.
1. Общие Требования
1.1. Сайт для Парсинга: Booking.com
1.2. Целевой Формат Выходных Данных: .txt файл с перечнем адресов электронной почты.
1.3. Интерфейс: Программа должна быть выполнена на языке Python с использованием библиотек для веб-скрейпинга и парсинга.
2. Функциональные Требования
2.1. Поиск Отелей
Входные Данные:
Название города.
Название страны.
Параметры Поиска:
Дата (любой выбор, так как это не критично для поиска).
1 взрослый.
1 номер.
Сортировка по оценке и количеству отзывов.
2.2. Фильтрация Отелей
Критерий: Отели должны иметь не менее 1500 отзывов. Отели с меньшим количеством отзывов пропускать.
2.3. Поиск и Сбор Почтовых Адресов
Шаги:
Копировать название отеля из списка результатов.
Вставить название отеля в поиск на Booking.com или в поисковую систему, чтобы найти сайт отеля (если сайт отеля не найден, пропустить отель).
На сайте отеля искать и собирать адреса электронной почты.
Если у отеля несколько адресов электронной почты, собирать все найденные адреса.
2.4. Форматирование и Сохранение Данных
Адреса электронной почты должны быть сохранены в текстовом файле .txt, каждый адрес на новой строке.