Midjourney vs Dalle: какая нейросеть лучше для проектирования UI?

(или “кто первым украдет наши рабочие места?” 👿)

Способен ли AI создавать UI?

Да, новая технология, известная как преобразование текста в изображение (T2I), создает изображения на основе текстовых запросов. А значит, искусственный интеллект может сгенерировать интерфейс, если мы дадим ему правильную подсказку. Как минимум, полученные результаты могут вдохновить нас на создание собственного проекта.

Но что насчет UX?

Модели искусственного интеллекта T2I предназначены для генерации изображений, поэтому они не способны решать UX-задачи так же хорошо, как человек. Хотя полученный результат может соответствовать UX-принципам (поскольку в его основе лежат существующие изображения), это настоящая игра в рулетку. В конечном счете, всегда лучше полагаться на собственные знания UX-принципов.

Однако AI все же может помочь в работе с UX. Обратитесь к ChatGPT, и он ответит на ваши вопросы и предоставит обратную связь по вашим проектам.

Какие AI-инструменты решают UI-задачи?

Я расскажу о двух T2I-инструментах: Midjourney и Dalle2. Они действуют по одному и тому же принципу, но были разработаны разными командами.

На данный момент Midjourney имеет одну из лучших моделей и работает по подписке. Dalle2 же создан компанией OpenAI, лидером в этой области, при поддержке Microsoft. У Dalle2 есть кредитная система, которая позволяет платить за запрос. Давайте сравним их!

Как правильно написать запрос?

Эксперименты — ключ к технологии T2I (поэтому я плачу за Midjourney, а не за Dalle). Не существует единственно верного способа создания запроса. Поэтому, хотя я не могу дать вам четкий ответ, я поделюсь тем, что узнал.

Вы можете создавать подсказки двух типов:

В формате предложения. Так, как вы бы объяснили задачу другому человеку. Пример: “пользовательский интерфейс приложения для ментального здоровья, разработанный в Figma, в плоском векторном стиле, который популярен на Dribbble”.

В формате токенов. В данном случае необходимо перечислить элементы, которые вы хотите видеть на изображении. Пример: “приложение для ментального здоровья, плоский вектор, Figma, dribbble, пользовательский интерфейс”.

Как правило, формат токенов работает лучше, поскольку он исключает ненужные слова из процесса обработки моделью. Однако иногда формат предложений все же полезен для описания взаимосвязей между понятиями.

Давайте протестируем оба способа, а также рассмотрим несколько других параметров, чтобы сравнить Midjourney и Dalle2.

Раунд 1: запросы в формате предложений

В рамках первого тестирования мы воспользуемся форматом предложений, чтобы сравнить две AI-модели.

Запрос: “минималистичный, технологичный пользовательский интерфейс приложения для ментального здоровья, разработанный в Figma, в плоском векторном стиле, который популярен на Dribbble и Behance в 2022 году и отмечен наградами”.

Анализируем результаты 1-го раунда

На мой взгляд, Midjourney оставил Dalle2 далеко позади в первом же раунде. Хотя некоторые элементы на изображениях Midjourney смазаны, они все равно выглядят целостно. Между тем, результаты Dalle2 скорее… разочаровывают.

Когда дело доходит до AI на его нынешнем этапе, мне нравится использовать специальный тест (squint test) для оценки результатов. Что я увижу, если прищурюсь или расфокусирую свой взгляд? Я легко мог бы представить результаты Midjourney в моей ленте dribbble. Чего нельзя сказать о результатах модели Dalle2.

Поэтому в первом раунде я безоговорочно отдаю победу Midjourney!

Раунд 2: запросы в формате токенов

Для проведения второго теста мы будем использовать формат токенов. Я добавлю в запрос еще несколько слов, чтобы результаты максимально соответствовали моим ожиданиям.

Запрос: “приложение для ментального здоровья, плоский вектор, Figma, dribbble, пользовательский интерфейс, Behance, технологии, минимализм, 2022, лучший в магазине приложений, отмеченный наградами дизайн, сине-белая цветовая схема”.

*Midjourney (слева) против Dalle2 (справа)*

Анализируем результаты 2-го раунда

Если говорить о моем зрительном тесте, здесь результаты моделей воспринимаются примерно одинаково, но, тем не менее, Midjourney опять выглядит более выигрышно. Этот инструмент выдает впечатляющие изображения, которые можно использовать в качестве референсов при разработке собственных интерфейсов. Кроме того, он умеет создавать вдохновляющие цветовые палитры и иллюстрации.

Победитель второго раунда — Midjourney.

Раунд 3: метод Криса Людерса

В третьем раунде мы протестируем метод Криса Людерса (Chris Lüders), немецкого UX-дизайнера, который опубликовал в твиттере лучший фреймворк для составления текстовых запросов, из всех, что я находил Интернете.

Предложенный им шаблон соответствует формату токенов и выглядит следующим образом:

“интерфейс в высоком разрешении, интерфейс приложения на тему [XYZ], UI-дизайн, мобильное приложение, iPhone, iOS, награда Apple Design Award, юзабилити, один экран, плоские цвета, Helvetica, нативное приложение, дизайн, пользовательский интерфейс, Figma, Apple Store, Dribbble.”

Давайте попробуем!

Ух ты! В этом раунде AI выдал действительно красивые результаты. Давайте заменим “тему [xyz]” на фразу “для ментального здоровья” и посмотрим, что из этого получится.

Анализируем результаты 3-го раунда

В этом раунде Midjourney окончательно вырвался вперед и оставил позади Dalle2. Он создал отличные макеты, которые могут послужить источником вдохновения для вашего следующего проекта.

Как ни странно, меня больше впечатлили результаты Midjourney “на тему [xyz]”, чем “для ментального здоровья”. Возможно, иногда отсутствие четких критериев идет только на пользу.

Итак, победитель третьего раунда — Midjourney.