Нужно сделать приложение для перевода видео/аудио звонков
Платформа: Windows / Desktop
Логика работы:
1) устанавливаем язык на который надо переводить
2) распознаем звук на компьютере (приложение или браузер или что то другое)
3) определяем язык (Google Speech-to-Text или аналог)
4) записываем в виде текста
5) переводим текст (Google Translate или аналог)
6) воспроизводим голосом (Google Speech-to-Text или аналог)
Есть наработки на Python
ffmpeg / vlc / Google speech to text /Google translate / google text to speech / tkinter / inno setup
Основные проблемы
1) Сделать синхронный перевод
2) Скорость перевода до 1 секунды.
3) Собеседник слышит звук перевода
4) Используется VB-Audio Virtual Cable, от него надо отказаться
5) Минимизировать сторонний соф и вес инсталлятора
6) При скачивании инсталлятора ругается на вирусы Defender