Нужно быстро генерировать изображения по текстовому описанию на обычном железе. Требования, в идеальном случае:
- Генерация до 5 секунд
- Ноутбучный процессор уровня i5-8xxxU и выше
- Поддержка Intel и AMD
- Без дискретного GPU (можно требовать интегрированный)
- Размер текстуры 512×512
- Лицензия OpenRAIL или более свободная
- Кроссплатформенность (Linux, Mac, нативный Windows без WSL/Net)
Если железо лучше, то скорость увеличивается. На слабом железе - низкая скорость вместо отказа работать.
Технически, это консольная программа, читает stdin построчно (каждая строка - prompt), сохраняет в текущую папку сгенерированное изображение (
%d.png), в процессе этого выводит в stdout отладочную информацию и прогресс, по Ctrl+C прерывает генерацию и читает следующую строку.
Параметры генерации (размер изображения и прочее) задаются константами в коде.
Генерироваться будут в первую очередь текстуры. Примеры запросов:
В разделе Backgrounds на Shutterstock у рисунков есть заголовки - это примерно то, что ожидается от пользователя:
https://www.shutterstock.com/category/backgrounds-...Стандартные модели SD/SDXL выдают приемлемый по качеству результат, но можно использовать другие модели.
Жестких требований к входному тексту нет - в приоритете качество/скорость генерации и допустимо требовать от prompt какого-то особого формата/синтаксиса.