Есть приложение на python + PostgreSQL, собирающее контактные данные с некого URL (сделано по ТЗ в приложении).
Работает не совсем корректно и требует доработки:
- неправильно обрабатывает URL источников
- неверно сохраняет номера телефонов (теряет одну цифру в конце)
- не собирает емейл адреса полностью, нужно дополнительно обойти URI внутри сайта и собрать
Важный момент: реальный URL, с которого идет сбор данных, не разглашается. Но HTML страницы, с которой собираются данные, есть.