OpenAI представила обновленную модель генерации изображений GPT-Image 1.5, которая точнее выполняет запросы, лучше сохраняет детали и работает до четырех раз быстрее предыдущей версии.
Теперь можно создавать новые картинки, пока прошлые еще генерируются. Новая модель доступна всем пользователям ChatGPT и через API.
Генеральный директор OpenAI Apps Фиджи Симо отмечает: ChatGPT движется к «полностью генеративному интерфейсу», который подстраивается под задачи пользователя.
GPT-Image 1.5 по-новому работает с редактированием: изменяет отдельные элементы на изображении, не портит остальное, лучше сохраняет освещение, композицию и лица. Можно добавлять, удалять, объединять и смешивать элементы.
Среди вариантов использования: фоторедактирование, виртуальный подбор одежды и причёсок, изменение стиля фото. В демо OpenAI показаны, например, объединение людей и собаки с разных снимков или превращение фотографии в постер «золотой эпохи Голливуда».
Модель стала лучше справляться с точными инструкциями. В одном из тестов GPT-Image 1.5 верно разместила объекты в ячейках сложной сетки, а предыдущая версия ошибалась. Это важно для задач, где принципиальна точная раскладка.
Генерация текста на картинках стала заметно четче. Модель рисует плотный, мелкий текст, поддерживает таблицы и инфографику с цифрами. При этом OpenAI признаёт, что длинные тексты, сложные шрифты, несколько лиц и другие языки пока могут давать сбои.
В тесте с необычным сценарием — лошадь катается на астронавте — старые модели не справились, а новая Image-1.5 и Flux 2 показали результат сопоставимый с Google Nano Banana Pro и намного лучше прежней версии.
Первое впечатление: новая модель ChatGPT создает более выразительные и контрастные изображения, чем Google Nano Banana Pro. При одинаковом запросе Nano Banana Pro делает кадры более «обычными» и близкими к реальной фотографии, у GPT-Image 1.5 — стиль «фотосессии». Возможна разница только из-за формулировки запроса.
Разработчики могут подключить модель как GPT Image 1.5 через API. По данным OpenAI, расходы на обработку изображений уменьшились на 20% — теперь цена составляет 8 долларов за миллион входных токенов и 32 доллара за миллион выходных токенов. Генерация текста стоит 5 и 10 долларов за миллион токенов соответственно. Для GPT-1 стоимость картинки была от 0,02 до 0,19 цента в зависимости от качества.
OpenAI утверждает, что новая версия лучше сохраняет фирменные логотипы и визуальные элементы — это может быть важно для маркетинга и интернет-магазинов. Прошлая версия ChatGPT для генерации изображений также доступна как отдельный GPT.






















