Российская компания победила на международном конкурсе распознавания речи CHiME-6
9-слойная свёрточная нейросеть с остаточными соединениями, в связке с 8-слойной нейросетью с задерживанием времени (TDNN-F) от российских исследователей победила в самой сложной задаче конкурса на распознавание английской речи с нескольких микрофонов в условиях естественной обстановки, то есть в условиях частичного наложения речи и шума (cocktail party problem или dinner party).
В таблице результатов ниже представлена команда STC-innovations Ltd. (дочерняя компания группы ЦРТ) и университета ИТМО. Научная статья с описанием технологии опубликована здесь.
Читать дальше →