Мы в Telegram
Добавить новость

"Наступление сетей": томский эксперт о трендах общепита

Известный блогер Тамаев попал в ДТП на люксовом авто около «Москва-Сити»

Блогер Асхаб Тамаев попал в ДТП около Москва-Сити

The Telegraph сообщила о планах Британии создать собственные ракеты к 2030 году



Новости сегодня

Новости от TheMoneytizer

Создать блок для извлечения данных по API

Предметом разработки являются четыре модуля:

  1. Web панель настройки загрузчика
  2. Загрузчик объявлений с https://e-disclosure.ru/ (с использованием официального API).
  3. Web панель настройки модуля извлечения именованных сущностей (NER).
  4. Модуль извлечения именованных сущностей (NER).

Данное описание описывает концепцию и основные функциональные блоки.



Посмотреть диаграмму на отдельной вкладке

Web панель настройки загрузчика

Основные требования:

  1. Настройки подключения (идентификаторы, ключи и т.п.)
  2. Интерфейс настройки компаний, публикации которых подлежат загрузки.
  3. Интерфейс мониторинга активности
    1. Последнее время загрузки.
    2. Кол-во полученный сообщений за выбранный период

Загрузчик объявлений

Основные требования:

  1. Непрерывная работа
  2. Учёт параметров загрузки публикаций без перезагрузки (периодическая проверка конфигурации и учёт изменений в ней)
  3. Минимизация времени задержки получения публикаций
  4. Передача полученных сообщений в очередь (предположительно в Apache Kafka)

Web панель настройки модуля извлечения именованных сущностей (NER)

  1. Ввод и редактирование правил извлечения.
  2. Интерфейс песочницы для тестирования правил. Интерфейс предлагает поле для ввода текста, выбора набора правил и вывод результата их применения.

Извлечение именованных сущностей (NER)

Требуется разработать алгоритм или модель для извлечения сумм и дат. Задача состоит в создании программного решения, которое автоматически сканирует входные тексты и извлекает значения, удовлетворяющие правилам.

Основные требования и задачи:

  1. Собрать и подготовить тренировочный набор данных, содержащий разнообразные примеры публикаций с известными значениями наименования компании, дат и сумм.
  2. Разработать алгоритм или модель, используя регулярные выражения, подходы машинного обучения или обработки естественного языка, которая сможет извлечь искомые значения из текстов публикаций с минимизацией времени исполнения и максимизации качества извлечения.
  3. Протестировать разработанное решение на тренировочном наборе данных и оценить его точность и эффективность.
  4. Написать инструкцию по развёртыванию в нужном окружении.
  5. Предоставить документацию с описанием алгоритма, модели или программного решения, а также инструкции по его использованию.

Общие требования к модулям

  1. Логирование существенно значимых операций.
  2. Отправки данных об исключений в Sentry.
  3. .NET Core (C#) или Python.
  4. Инструкции по развёртыванию и обновлению.

Читайте на 123ru.net


Новости 24/7 DirectAdvert - доход для вашего сайта



Частные объявления в Вашем городе, в Вашем регионе и в России



Smi24.net — ежеминутные новости с ежедневным архивом. Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net. Мы не навязываем Вам своё видение, мы даём Вам срез событий дня без цензуры и без купюр. Новости, какие они есть —онлайн с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии. Smi24.net — живые новости в живом эфире! Быстрый поиск от Smi24.net — это не только возможность первым узнать, но и преимущество сообщить срочные новости мгновенно на любом языке мира и быть услышанным тут же. В любую минуту Вы можете добавить свою новость - здесь.




Новости от наших партнёров в Вашем городе

Ria.city

The Telegraph сообщила о планах Британии создать собственные ракеты к 2030 году

Сегодня в России отмечается День работника скорой помощи

"Наступление сетей": томский эксперт о трендах общепита

Блогер Асхаб Тамаев попал в ДТП около Москва-Сити

Музыкальные новости

Шапки женские вязаные на Wildberries, 2024 — новый цвет от 392 руб. (модель 466)

Шапки женские на Wildberries — скидки от 398 руб. (на новые оттенки)

В Москве завершился Кубок России по спортивному программированию

В Орле определился победитель Чемпионата Черноземья по хоккею с шайбой

Новости России

"Не раскаивается": Детали дела Аббасова от депутата Медведева. С жертвой Шахина попрощались лишь накануне

В Моршанске скоро откроется виртуальный концертный зал

Обязательная программа для дачника: что нужно успеть на огороде в майские праздники

Гладилин: «Локомотив» перестал зависеть от Дзюбы»

Экология в России и мире

Отдых во имя открытий

Токсиколог Кутушов рассказал почему возникает похмелье

Весенние субботники прошли на предприятиях «Московского» филиала ООО «ЛокоТех-Сервис»

Шапки женские на Wildberries — скидки от 398 руб. (на новые оттенки)

Спорт в России и мире

Елена Рыбакина рассказала о проблемах на турнире в Мадриде

Потапова проиграла Фернандес во втором круге турнира WTA в Мадриде

Шикарный и практичный стиль Елены Джокович из базовых вещей

Самсонова победила Осаку и вышла в третий круг турнира WTA 1000 в Мадриде

Moscow.media

Сотрудники спецподразделений столичного главка Росгвардии окончили обучение в Центре профподготовки в Подмосковье

Каршеринг BelkaCar и картографический сервис 2ГИС запустили серию совместных маршрутов

Военные следователи провели в Судаке проверку лиц, не вставших на воинский учет

звезды шоу-бизнеса посетили весеннюю неделю моды estet fashion week











Топ новостей на этот час

Rss.plus






Блогер Асхаб Тамаев попал в ДТП около Москва-Сити

Минобороны РФ показало кадры ночной поисков-спасательной работы вертолетов Ми-8

Сегодня в России отмечается День работника скорой помощи

Авиакомпанию S7 оштрафовали на 30 тысяч рублей за нарушение прав пассажиров