Gemini 2.5 Flash Image: Gerçekçi görseller için Google’dan yeni model
Google, son teknoloji ürünü görüntü oluşturma ve düzenleme modeli Gemini 2.5 Flash Image’ı duyurdu. Daha önce “nano-banana” adıyla test edilen bu model, karakter tutarlılığını koruyarak ve birden fazla görseli tek bir sahnede birleştirerek yeni görüntüler oluşturabiliyor.
En iyi görüntü düzenleme modeli
LMArena verilerine göre Gemini 2.5 Flash Image, OpenAI’nin GPT Image 1 ve Flux.1 Context modellerini geride bırakarak dünyanın en çok beğenilen görüntü düzenleme modeli haline geldi.
Önceki modeller estetik açıdan güçlü olsa da gerçek dünyayı anlamada zayıf kalıyordu. Yeni Gemini 2.5 Flash Image ise Gemini’nin dünya bilgisini kullanarak daha doğru ve gerçekçi görseller üretiyor.
Hem tüketiciler hem de geliştiriciler için
Yeni model, hem bireysel kullanıcılar hem de geliştiriciler tarafından kullanılabiliyor.
Geliştiriciler için: Gemini API, Google AI Studio ve Vertex AI üzerinden erişilebiliyor. Fiyatlandırma, 1 milyon çıktı jetonu başına 30 dolar olarak belirlenmiş durumda. Bu da görüntü başına yaklaşık 0,039 dolar maliyet anlamına geliyor.
Tüketiciler için: Gemini web ve mobil uygulamaları üzerinden erişim sağlanabiliyor.
Kullanım senaryoları
Google, Gemini 2.5 Flash Image’ın öne çıkan kullanım alanlarını şöyle sıralıyor:
Kostüm ve mekan değişikliği: Bir kişi veya evcil hayvanın fotoğrafını yükleyerek farklı ortamlara uyarlayın. Model, görünümdeki tutarlılığı koruyor.
Fotoğrafları birleştirme: Birden fazla fotoğrafı yükleyerek yeni bir sahne oluşturun. Örneğin, kendi fotoğrafınız ile köpeğinizin fotoğrafını birleştirip basketbol sahasında bir portre elde edebilirsiniz.
Çok adımlı düzenleme: Bir görüntüyü defalarca düzenleyin. Örneğin boş bir odanın duvarlarını boyayın, ardından kitaplık, masa veya mobilyalar ekleyin.
Stil transferi: Bir görselin stilini başka bir nesneye uygulayın. Örneğin çiçek yapraklarının dokusunu gökkuşağına, bir kelebeğin kanat desenlerini ise bir elbise tasarımına aktarabilirsiniz.
Güvenlik ve filigran kullanımı
Google, kullanıcıların yüklediği görselleri eğitim verisi olarak kullanmadığını vurguluyor. Gemini uygulaması üzerinden üretilen her görselde görünür bir filigran ve SynthID teknolojisiyle görünmez bir dijital filigran yer alıyor.