Новая модель, получившая название KOALA, стала настоящим прорывом в области создания изображений практически мгновенно.
ETRI разработали не только KOALA, но также две модели диалогового визуального языка KoLLaVA, способные отвечать на вопросы пользователей с использованием изображений и видеороликов. Одним из ключевых преимуществ KOALA стало его компактное исполнение, что позволяет модели работать на более доступных графических процессорах с небольшим объемом памяти.
Создание изображения высокой детализации и разрешения теперь занимает всего 1,6 секунды благодаря новому технологическому решению ETRI. В то время как у конкурирующей нейросети DALL-E 2 от компании OpenAI на то же задание уходит 12,3 секунды. Это значительное улучшение в скорости работы позволит эффективнее создавать качественные изображения.