Midjourney 5.1 выходит — и это еще один скачок вперед для искусственного интеллекта
Выпущена версия Midjourney 5.1, которая обеспечивает еще одно значительное улучшение качества результатов генеративного ИИ-сервиса.
Компания утверждает, что версия 5.1 движка «более самоуверенна», что приближает ее к результатам, которые вы могли бы получить с версией 4 Midjourney, но с более высоким качеством. Также есть «сырой» режим для тех, кто не хочет, чтобы изображения были столь же самоуверенными.
Другие заявленные улучшения включают в себя более высокую точность, меньшее количество нежелательных границ или текстовых артефактов на изображениях, а также повышенную резкость.
Середина тестирования 5.1
Я проверил новую версию Midjourney, используя те же подсказки в версии 5 и версии 5.1 и сравнивая результаты. Все остальные настройки остались прежними, а для Midjourney установлено базовое качество и средний стиль.
На всех изображениях ниже четыре изображения слева — это Midjourney 5, а четыре изображения справа — версия 5.1.
Здесь подсказка была «женщина, идущая по мощеной улице навстречу закату»:
была постоянная проблема с чрезмерно агрессивными, искусственными бликами линз в Midjourney 5, поэтому приятно видеть, что эта проблема решена в версии 5.1. Закат на изображениях версии 5.1 выглядит более естественным, с более теплым и интересным небом.
Вторая подсказка, которую я использовал, была «взрыв на заводе по производству красок, векторное искусство»:
Опять же, изображения в Midjourney 5.1 намного лучше, чем в эквивалентах версии 5, лучше используют цвет и предлагают более динамичные композиции. Верхнее левое и нижнее правое изображения из версии 5.1 особенно эффектны.
Лица стали настоящей силой результатов Midjourney, поэтому для следующего изображения я попросил ИИ создать «крупный план ребенка в плавательных очках»:
Здесь мы можем увидеть, что Midjourney имеет в виду, говоря о том, что в версии 5.1 изображения стали более «самоуверенными». Изображения версии 5 слева хороши, но очень прямые, похожие на снимки камеры смартфона детей в очках. Изображения 5.1 справа имеют гораздо более сильное редакционное ощущение, как будто они были сделаны профессиональным фотографом. Изображение в правом нижнем углу особенно бросается в глаза.
Наконец, я хотел проверить обещание меньшего количества текстовых артефактов, запросив «продавец газет на углу улицы, стиль 1950-х, сепия»:
Во-первых, примечательно, что обе версии неправильно поняли подсказку, представляя то, что выглядит как продавец с газетой, а не продавец газет, но это можно легко исправить с помощью подсказки. Оба имеют текст на заднем плане, а не саму газету, но между ними нет большой разницы. Текст в обоих наборах изображений выглядит нормально издалека, но когда вы увеличиваете масштаб, он в значительной степени бессмысленен. Изображения версии 5.1 имеют более четкую композицию, при этом объект занимает большую часть кадра.
Как использовать Midjourney 5.1
Последняя версия в настоящее время находится в стадии тестирования, но клиенты Midjourney могут переключиться на версию 5.1 по умолчанию с помощью команды /settings в Discord.
Компания планирует сделать Midjourney 5.1 режимом по умолчанию уже в конце этой недели.