Есть модель на PyTorch. Нужно её модифицировать для двух целей:
Оптимизация для серверного API (мобильный клиент)
Задача — снизить потребление ресурсов. Предлагаем рассмотреть pruning и quantization для уменьшения объёма вычислений и памяти. Открыты к другим предложениям по оптимизации.
Конвертация для мобильных устройств
Задача — переписать модель для TensorFlow Lite или PyTorch Mobile с возможной оптимизацией (pruning, quantization) или другими методами, предложенными разработчиками.