Мы в Telegram
Добавить новость

Ефимов: столица смогла снизить стоимость строительства недвижимости на 19,7 млрд рублей

В Одинцово семья из трех человек погибла в ДТП с грузовиком

Пьяный мужчина без прав на дорогой иномарке насмерть сбил ребенка на остановке в Можайске

Лесной пожар ликвидировали в Раменском округе





Новости сегодня

Новости от TheMoneytizer

Доработать скрипт на Python для подсчета вхождений слов в Title, Descr

Есть готовый, работающий скрипт на Python (вот https://colab.research.google.com/drive/17sodRyJm3rXanOaTWnOPqc3za_yxEQ-x#scrollTo=CStyBM1YELWg), который обрабатывает 2 файла.
Первый файл (Файл_1_ключевые_фразы) содержит ключевые фразы и URL адреса страниц сайта, для которых они предназначены.
Второй файл (Файл_2_парсинг) содержит URL адреса страниц и заранее спарсеные с них Title, Meta Description, H1, Body text.
После отработки скрипта автоматически создается новый файл (Результат работы скрипта), содержащий результаты проверки наличия ключевых слов в Title, Meta Description, H1, Body text в формате True - фраза присутствует и False - фраза не найдена.

Требования:
1. Каждая ключевая фраза должна быть на отдельной строке, как в исходном файле Файл_1_ключевые_фразы. На данный момент не устраивает то, что ключевый фразы раскидываются по отдельным столбцам. Пример во вложении (файл Пример форматирования, в нем 2 листа).
2. Если фраза целиком не входит в соответствующую текстовую зону (Title, Meta Description и т.п.), то должны отображаться слова из фразы, которые отсутствуют (не обнаружены) в текстовой зоне.
3. Если фраза и или слово найдено, должно отображаться количество раз, которое фраза или слово встречаются в соответтствующей текстовой зоне страницы.
4. Добавить заполнение поля "Recommendation" на основе следующей логики:
Самая высокочастотная фраза всегда добавляется в рекомендацию в Title, если она не найдена в текстовых зонах.
Для одной и той же страницы рекомендуются к добавлению все слова из остальных фраз для этой страницы, кроме слов, встечающихся в самой высокочастотной фразе, до тех пор, пока суммарная длина самой высокочастотной фразы и отдельных слов меньше или равна 65 символам.
Аналогичная логика для Meta Description и Body с другими лимитами.







Опционально:
- Исключить из проверки предлоги, находящиеся в проверяемых фразах (можно добавить список стоп-слов)
- Добавить лемматизацию фраз и текстовых зон при проверке.



Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

Василия Бойко-Великого вернули на подмосковную землю // Дело бизнесмена рассматривается заново

Житель Москвы зацементировал себе половой орган, когда делал скульптуру

Куплю, обмен старые Швейцарские франки, бумажные Английские фунты стерлингов и другие

Реванш Кнороз, невзрачный результат Моргунова, серии Лысенко и Кочановой: как прошёл Фестиваль прыжков в Москве

Музыкальные новости

Бурятский Театр кукол Ульгэр в Улан-Улан-Удэ показал в Этнографическом музее народов Забайкалья перед детьми и родителями в семейный праздник сказку Колобок - Новости и Культура, Дети и Россия

Concord is skipping free-to-play and pulling a Helldivers 2 instead: $40 for the full game with all 16 heroes at launch

Собянин рассказал, что столичные промышленники производят для метро Москвы

Приглашенные солистки выступят в опере «Руслан и Людмила»

Новости России

Житель Москвы зацементировал себе половой орган, когда делал скульптуру

Медвежья услуга: Додон хочет заменить Санду, но делает только хуже России

Участники форума «Формируя будущее» посетили выставку «Россия» на ВДНХ

На набережных столицы стартует фестиваль «Лето в Москве. Все на улицу!»

Экология в России и мире

Помощь российских армян СВО. Поддержка тыла важна для передовой

Бурятский Театр кукол Ульгэр в Улан-Улан-Удэ показал в Этнографическом музее народов Забайкалья перед детьми и родителями в семейный праздник сказку Колобок - Новости и Культура, Дети и Россия

Подсаживал к обезьяне птицу и вымогал у туристов 20 тысяч рублей: в Сочи арестован фотограф, действующий по накатанной схеме

Proenza Schouler, коллекция pre-fall 2024

Спорт в России и мире

Зверев вышел в финал «Ролан Гаррос»

Тарпищев о Медведеве и Рублеве: без травм сыграют в Париже лучше, чем в Токио

«Мирра Андреева обладает удивительной выживаемостью» // Олимпийская чемпионка по теннису Елена Веснина об итогах женского Roland Garros

Экс первая ракетка мира Виландер оценил шансы Паолини на победу в финале «Ролан Гаррос»

Moscow.media

«Автодор» – к концу 2025 года скоростными дорогами госкомпании будет охвачена половина населения России

В этом году планируют заключить контракт на реконструкцию еще одного участка трассы Р-23 в Ленобласти

Гора Бабырган

В Орле опять неполадки с движением троллейбусов











Топ новостей на этот час

Rss.plus






Реванш Кнороз, невзрачный результат Моргунова, серии Лысенко и Кочановой: как прошёл Фестиваль прыжков в Москве

Куплю, обмен старые Швейцарские франки, бумажные Английские фунты стерлингов и другие

Медвежья услуга: Додон хочет заменить Санду, но делает только хуже России

Анатолий Цой признался, зачем ему телешоу