Mistral AI объявила о запуске Pixtral 12B, своей первой мультимодальной модели ИИ, что ставит компанию в прямую конкуренцию с OpenAI и Anthropic. Новая модель доступна для загрузки с таких платформ, как Hugging Face, GitHub и даже через торрент.
Хотя конкретные подробности об обучающих данных не разглашаются, Pixtral 12B предназначен для того, чтобы пользователи могли загружать изображения и запрашивать подробности об их содержании с помощью текстовых запросов.
София Янг, руководитель отдела по работе с разработчиками Mistral, отметила отличительную особенность модели: ее способность обрабатывать произвольное количество изображений любого размера. Первые тестеры сообщили, что Pixtral 12B может похвастаться сложной архитектурой. Зрительный компонент включает специальный софт, поддерживающий разрешение изображения 1024×1024, и 24 скрытых слоя для расширенной обработки изображений.
Вскоре Pixtral 12B станет доступен через API.