Есть большой список автомобильных запчастей ( > 10 млн) с описанием текстом до 1024 символов.
У многих позиций есть больше одного описания.
Нужно
Каждому описанию поставить оценку качества.
На основе всех описаний, начиная с определенной оценки, составить одно полное
Описания бывают
На английском
На русском
Включающие в себя номера и артикулы
Ошибочные
У операторов должна быть возможность обучить (и дообучать) систему на примерах.
Реализация желательно на c#
ML.NETОператоры наши
Результат проекта - правильная оценка и выбор 100 000 записей (дальше мы сами)