Мы в Telegram
Добавить новость

Российская авиакомпания анонсировала 16 новых маршрутов из Томска

«Крым и Севастополь готовятся». На полуострове ожидают высокий курортный сезон 2024 года

Массовое ДТП произошло на Ленинградском шоссе в Москве

Треть российских туристов поедут летом за границу



Новости сегодня

Новости от TheMoneytizer

Парсер на PHP

есть уже работающий парсер сделанный на PHP на linux debian.

есть API уже работающий с сайтом.

работает пока только с одним донором.

Задачи:

Изучить парсер который уже имеется для дальнейшего развития .

Вся работа документируется на Гитлаб .

Нужно настроить парсер на работу с другими донорами (5 разных сайтов).

Настроить API для работы парсера с сайтом .

Поддержка на постоянной основе (за отдельную оплату)

Описание работы парсера :

Парсер построен на PHP - собирает данные и отдает данные по API сайту.

Собирает данные компьютерных комплектующих с разных сайтов поставщиков

особенности сайтов

* сайты RTL

* авторизация обязательна

* на сайтах присутствуют разного рода защиты от бота (не на всех но есть)

* названия товаров иногда имеют слова и фразы добавленные в названия товара(очистить)

* в характеристиках товаров присутствуют фразы которые нужно очистить (не везде)

* почти у всех сайтов разная структура категорий(нужно привести все к 1 общей структуре)

особенности работы парсера

- сайт может стучаться по API к парсеру и принимать различные данные

* полный парсинг данных

* проверка на наличие у поставщика комплектующих (различные статусы)

* проверка цены (обновление цены на сайте)

* id товаров (присваивает каждому уникальный)

* повторяющиеся товары от разных поставщиков не конфликтуют (разные коды SKU генерация приставки берется от названия поставщика и прибавляется к коду товара)

* фильтры и очистка названий товара от добавляемых слов поставщиками

* парсер присваивает id категориям для того чтобы правильно добавлять товары на сайте

* парсер находит не нужные значения у продуктов и очищает их

что парсим:

* Название продукта (требуется фильтрация текста и очистка от определенных фраз)

* Код продукта

* Код продукта с генерацией префикса для различия одного и того же продукта от разных поставщиков

* Картинки продукта (ссылки)

* Ссылка на продукт

* Описание (требуется фильтрация текста и очистка от определенных фраз)

* Характеристики (требуется фильтрация текста и очистка от определенных фраз)

* наличие (доступность к заказу)

* статусы (если не доступен к заказу то есть статусы когда возможны или нет)

* категории групп товаров

* производитель

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

78% россиян отслеживают свои доходы и расходы

«Россети Московский регион» оштрафовали за нарушение в Ленинском округе

«Крым и Севастополь готовятся». На полуострове ожидают высокий курортный сезон 2024 года

Пентагон обвинил Россию в запуске противоспутникового оружия

Музыкальные новости

Театр и Культура, Россия и Дети: 15 мая театр кукол Ульгэр представил спектакль «Мүнгэн мүшэдүүд» в стенах Художественного музея для первых классов гимназии №29 Улан-Удэ

Тревел-тату как искусство: Яндекс Плюс запустил проект «Из путешествия – с татуировкой»

«Просто не афиширую»: куда пропала Волочкова с театральной сцены

Июньские дни духовности: Православные праздники месяца от ясновидящей Галины Янко

Новости России

Массовое ДТП произошло на Ленинградском шоссе в Москве

Треть российских туристов поедут летом за границу

Пентагон обвинил Россию в запуске противоспутникового оружия

78% россиян отслеживают свои доходы и расходы

Экология в России и мире

В Турции в ужасе удивились: сотни нелегальных отелей как ни в чем не бывало принимают туристов и выставляются на площадках бронирования

Почему употребляющим алкоголь и желающим похудеть надо каждый день пить томатный сок: раскрыта его невероятная польза

Лукашенко лоббирует интересы Алиева по изоляции Армении

Выездной Фотограф для всех желающих, ну и конечно Артистов и Музыкантов.

Спорт в России и мире

Теннисист Медведев потеряет место в рейтинге ATP

Российский теннисист Медведев опустится на строчку в рейтинге ATP

Арина Соболенко сняла траур по Кольцову и завела новые романтические отношения

Шнайдер вышла в финал турнира WTA-125 в Париже, обыграв Грачёву

Moscow.media

Сотрудник Дубненского отдела вневедомственной охраны Главного управления Росгвардии по Московской области встретился с учащимися МОУ СОШ №1

Новые наушники Nothing Ear и Ear (a) уже доступны

Чесменская церковь.Санкт-Петербург

Шапки женские на Wildberries — скидки от 398 руб. (на новые оттенки)











Топ новостей на этот час

Rss.plus






Массовое ДТП произошло на Ленинградском шоссе в Москве

"Пылинки с него сдувала": Школьник-мажор из элитного посёлка в Москве расправился с экономкой и "забыл"

«Крым и Севастополь готовятся». На полуострове ожидают высокий курортный сезон 2024 года

Магаданский художник Константин Кузьминых получил звание "Народный художник Российской Федерации"