💡Google покращила генерування зображень в Gemini завдяки ШІ-моделі nano-banana

Google підтвердила, що таємнича ШІ-модель nano-banana, яка вразила користувачів сайту LMArena, це її розробка. Вона лягла в основу оновлення чатбота Gemini для генерації та обробки зображення і надає точний контроль над редагуванням фотографій.

Оновлення під назвою Gemini 2.5 Flash Image буде доступне з вівторка для всіх користувачів додатка Gemini, а також для розробників через Gemini API, Google AI Studio та платформи Vertex AI, відзначає TechCrunch.

Нова модель штучного інтелекту Gemini призначена для більш точного редагування зображень на основі запитів користувачів природною мовою, зберігаючи при цьому цілісність облич, тварин та інших деталей, що зазвичай погано виходить у ШІ. Наприклад, якщо попросити у чатботів ChatGPT або Grok змінити колір сорочки людини на фотографії, у відповідь вони можуть видати змінене обличчя чи фон.

Нові функції Gemini також дозволяють завантажувати до трьох фотографій для того, щоб ШІ об’єднав їх в одну. За допомогою промптів користувачі можуть вказати, які об’єкти, елементи, кольори чи текстури з референсів потрібно використовувати на фінальному зображенні.