Spis treści
Natywna Edycja obrazów w ChatGPT, Gemini i Grok
W marcu 2025 roku ChatGPT, Google Gemini i Grok wprowadziły natywne funkcje generowania i edycji obrazów, rewolucjonizując sposób tworzenia wizualnych treści.
Oto porównanie edycji zdjęcia krakowskiego Wawelu w stylu Ghibli z generacjami ze wszystkich 3 platform.

Oto oryginalne zdjęcie
ChatGPT 4o (OpenAI Image Generator)
OpenAI zaktualizował model GPT-4o, dodając natywny generator obrazów o wysokiej rozdzielczości i zaawansowane funkcje edycji za pomocą tekstowych komend, np. zmiana stylu czy dodanie elementów. Popularność funkcji wzrosła dzięki obrazom w stylu Ghibli w mediach społecznościowych. Dostępna dla wszystkich użytkowników, lecz z ograniczeniami.

Gemini (Gemini 2.0 Flash)
Google rozszerzył Gemini 2.0 Flash o eksperymentalne generowanie i edytowanie obrazów w Google AI Studio. Model pozwala na wieloetapowe, kontekstowe modyfikacje obrazów za pomocą naturalnego języka, wykorzystując wiedzę i rozumowanie do tworzenia realistycznych wizualizacji, np. ilustracji kulinarnych. Dostępna dla deweloperów we wszystkich regionach obsługiwanych przez Google AI Studio: ai.dev

Grok (xAI)
Grok od xAI zyskał natywne wsparcie dla generowania i edycji obrazów, umożliwiając użytkownikom tworzenie wysokiej jakości wizualizacji i modyfikowanie dostarczonych zdjęć za pomocą tekstowych komend. Funkcja dostępna na X w wybranych krajach od marca 2025, z planowanym pełnym wdrożeniem, oraz na Telegramie, oferując wszechstronność w stylach i kompozycjach.
Darmowe dla każdego użytkownika Grok z poziomu platformy X.


