Близнецы нано банан улучшает согласованность и контроль редактирования изображений в масштабе для предприятий — но не идеально

admin

Хотите более умное понимание в вашем почтовом ящике? Подпишитесь на наши еженедельные информационные бюллетени, чтобы получить только то, что имеет значение для искусственного интеллекта предприятия, данных и лидеров безопасности. Подписаться сейчас


Google выпустил Gemini 2.5 Flash Image, новую модель, которую многие бета -пользователи знали как нанобанана, которая дает предприятиям больше выбора для творческих проектов. Это позволяет им изменить внешний вид изображений, в которых они нуждаются быстро и с большим контролем, чем предлагали предыдущие модели.

Модель будет интегрирована в приложение Близнецов.

Модель, построенная на вершине Flash Gemini 2.5, добавляет больше возможностей к нативному редактированию изображений в приложении Gemini. Flash Image Gemini 2.5 поддерживает сходство символов между различными изображениями и имеет большую последовательность при редактировании изображений. Если пользователь загружает фотографию своего питомца, а затем просит модель изменить фон или добавить шляпу своей собаке, Flash -изображение Gemini 2.5 сделает это без изменения предмета изображения.

«Мы знаем, что при редактировании фотографий себя или людей, которых вы хорошо знаете, имеет значение тонкие недостатки, изображение, которое« близко, но не совсем то же самое », не чувствует себя правильным», — сказал Google в посте в блоге, написанном Gemini Apps MultiModal Generation Generation Devil Sharon и Google Deepmind Gemini Product Product Nicole Brichtova. «Вот почему наше последнее обновление предназначено для того, чтобы сделать фотографии ваших друзей, семьи и даже ваших домашних животных последовательно, как они себя».

Одна жалоба предприятия и некоторые отдельные пользователи имели то, что при подаче прав на изображения, сгенерированные AI, небольшие изменения изменяют фотографию. Например, кто -то может дать указание модели переместить позицию человека на картинке, и, хотя модель делает то, что говорит, лицо человека слегка изменяется.

Все изображения, сгенерированные на Близнецах, будут включать в себя синтидный водяной знак Google. Модель доступна для всех платных и бесплатных пользователей приложения Gemini.

Волнение в социальных сетях

Предположение о том, что Google планирует выпустить новую модель изображения, которая будет безудержной на платформах социальных сетей. Пользователи на LM Arena увидели новую загадочную модель под названием Nanobanana, которая последовала за «сложными, многоэтапными инструкциями с впечатляющей точностью», как сказал партнер Andresen Horowitz Justine Moore.

Вскоре люди заметили, что модель нанобанана, казалось, была от Google, прежде чем несколько ранних тестеров подтвердили это. Хотя в то время Google не подтвердил, что он планировал делать с моделью на LM Arena.

До этой недели спекуляции о том, когда модель будет продолжаться, что в некотором роде пророчно.

Большая часть волнения возникает в качестве боя между поставщиками моделей, чтобы предложить более способные и реалистичные изображения и редакторы, показывая, насколько мощными мультимодальными моделями стали.

Тем не менее, Google по-прежнему должен бороться с конкурентами, такими как QWEN и недавно выпущенный QWEN-Image Edit и OpenAI, которые добавили нативные изображения ИИ в CHATGPT, а также сделали модель доступной в качестве API.

Конечно, Adobe, давно считавшаяся одним из лидеров в пространстве редактирования изображений, добавила свою флагманскую модель Firefly в Photoshop и другие платформы для редактирования фотографий.

Редактирование нативного изображения

Gemini добавил нативное редактирование изображений ИИ на Близнецах в марте, которое он предложил бесплатным пользователям платформы чата.

Привлечение функций редактирования изображений непосредственно в платформу чата позволит предприятиям исправлять изображения или графики без перемещения окон.

Пользователи могут загрузить фотографию в Gemini, а затем сообщить модели, какие изменения они хотят. После того, как они будут удовлетворены, новые картинки могут быть перегружены в Близнецы и превращены в видео.

Помимо добавления костюма или изменения местоположения, Flash-изображение Gemini 2.5 может смешать разные фотографии, предлагает многообразие и микширование стилей одной картинки с другой.



Источник

Рекомендуем

Оставить комментарий