В России разработали новый тест для проверки рассуждений ИИ в длинном мультимодальном контексте
Ученые института AIRI разработали MMReD – новый бенчмарк для оценки того, насколько хорошо большие языковые модели...
Ученые института AIRI разработали MMReD – новый бенчмарк для оценки того, насколько хорошо большие языковые модели...