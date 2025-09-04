Myös nano-bananaksi kutsuttu Gemini 2.5 Flash parantaa 2.0 Flashiin verrattuna suorituskykyä LMArenan Image Edit testissä lähes neljänneksellä, mikä riittää suorituskykylistojen kärkeen selvällä erolla.

Googlen DeepMind on päivittänyt jälleen yhtiön tekoälytarjontaansa uudella kuvien muokkaukseen erikoistuneella kielimallilla. Uusi ”nano-banana” eli tuttavallisemmin Gemini 2.5 Flash Image -kielimalli on käytettävissä Gemini-sovelluksen kautta.

Google toi kuvien muokkausmahdollisuuden osaksi Gemini-sovellusta aiemmin tänä vuonna Gemini 2.0 Flash -kielimallin voimin. Uudessa 2.5 Flash -versiossa on keskitytty etenkin hahmojen säilyvyyden parantamiseen, mikä mahdollistaa saman hahmon säilyttämisen kuvassa, vaikka sitä muokattaisiin useaankin kertaan eri komennoin. Toinen merkittävä kehityspaikka on ollut kuvassa esiintyvän henkilön sovittaminen tiettyyn malliin, kuten vaikka keräilykorttiin tai kulkulätkään, sopiviksi.

Merkittävä uudistus Gemini 2.5 Flashissa on myös komentopohjainen, kohdistettu ja tarkka kuvanmuokkaus luonnollista kieltä käyttäen. Esimerkkeinä sen käyttökohteista Google listaa esimerkiksi erilaiset sumennusefektit, tahrojen poistaminen kuvauskohteen vaatteista tai vaikka jo pitkään tekoälypohjaisissa kuvanmuokkausominaisuuksissa mukana ollut hahmon poisto kuvasta. Se osaa myös yhdistää nyt useamman kuvan entistä paremmin yhdeksi luonnolliseksi kokonaisuudeksi.

Gemini 2.5 Flash ymmärtää nyt myös paremmin maailman päälle, hyödyntäen Geminin muiden ominaisuuksien tietämystä. Se parantaa esimerkiksi käsin piirrettyjen kuvien tunnistamista, pulmien hahmottamista, laskukaavojen ymmärtäminen kuvan pohjalta ja niin edelleen.

Googlen esittelee mallin suorituskykyä LMArenan kokonaistuloksella sekä viidellä yksittäistestillä, mutta valitettavasti yksittäistestien lähdettä ei ole listattu, eikä ne ole ainakaan suoraan nähtävillä LMArenan sivuilla. Verrokkina Gemini 2.5 Flashilla ovat ChatGPT 4o / GPT Image 1 (High), FLUX.1 Kontext [max], Qwen Image Edit ja Gemini 2.0 Flash. Gemini 2.5 Flash nousi 1362 pisteellään suoraan listan kärkeen selvällä erolla ennen FLUX.1 Kontext (max 1191, pro 1174) ja ChatGPT 4o:n GPT Image 1 -malleja (1170). Gemini 2.0 Flashin yhteispisteet ovat 1093.

Lähteet: Google (1), (2)