Есть написанный код для object detection, где нарезается изображения большого размера, и адаптируется bounding boxes для каждого объекта. Суть задачи заключается в том, что нужно сделать так, чтобы изображения нарезались правильно, а так же bounding boxes адаптировались как нужно. Модель был выбран FastRCNN, используется библиотека torch, при обучении loss снижается до третьей эпохи, и на третьем начинает скакать.
Суть задачи, который должен решать код, заключается в object detection, есть датасет, где изображения имеют неодинаковые размерности, нужно стандартизировать в одну, потом обучить модель, и оценить модель через mAP. И в конце визуализировать некоторые изображения, а также засабмитить предикты в виде нижеприкрепленного скриншота в .csv формате. А также нужно использовать метрику IoU для детекции объектов.