
A Google szállít Google Nano Banán, a Gemini alkalmazáson túlmutató mesterséges intelligenciával vezérelt képgeneráló és -szerkesztő eszközét. A vállalat megkezdte az integrálását a Google Keresésbe a Lens és a NotebookLM segítségével, és azt is megerősítette, hogy hamarosan a Google Fotókba is érkezik.
A Gemini 2.5 Flash Image modellen alapuló mesterséges intelligencia a szöveges utasításokat vizuális eredményekké alakítja, amelyek megőrzik a karakterek és a stílus egységességét. A vállalat szerint a felhasználók már generáltak... több mint 5.000 milliárd kép, olyan termékekre vezetve be, amelyeket sokan nap mint nap használnak, kezdetben az Egyesült Államokban, majd a tervek szerint további nyelvekre és régiókra is kiterjesztik.
Mi az a nanobanán és hogyan működik?
Lényegében a Nano Banana értelmezi természetes nyelvi promptok képeket készíthet a semmiből, vagy precíz módosításokat alkalmazhat egy fotón. Módosíthatja a háttereket, beállíthatja a színeket, eltávolíthat tárgyakat vagy embereket, visszaállíthat régi képeket, kicsinyíthet, módosíthatja a kifejezéseket, és több felvételt egyetlen összefüggő jelenetbe egyesíthet.
Az egyik kulcsa az vizuális következetesség: Megőrzi az arcvonásokat és a tárgyak elrendezését több szerkesztés során is, ami különösen hasznos egy karakter vagy stílus több variációban való megőrzéséhez. Minél részletesebb a kérés, annál hűbb az eredmény.
A nyomonkövethetőség megerősítése érdekében a Google hozzáteszi SynthID (látható vízjel és digitális jel a metaadatokban) a létrehozott vagy szerkesztett képeken, segítve az ezzel a technológiával előállított tartalom azonosítását anélkül, hogy befolyásolná annak érzékelt minőségét.
Keresés és Google Lens: Alkoss és szerkessz a mobilodról
A Google alkalmazásban a Lens bemutatja a „Létrehozás” módInnen készíthetsz egy fotót, vagy választhatsz egyet a galériádból, és beírhatod az utasításokat, hogy a mesterséges intelligencia azonnal alkalmazhassa a módosításokat. Egyes eszközökön egy „Nano Banana Create” gomb jelenik meg a keresési és fordítási lehetőségek mellett, így gyorsan elérheted ezeket a funkciókat.
Tapasztalati útmutatók a típus példáival "Változtass bábuvá" vagy „Tegyél egy európai utcára”, és lehetővé teszi az elülső és a hátsó kamera közötti váltást a kérés elküldése előtt. A rögzítés után a kép hozzáadódik az AI mód szövegmezőjéhez, hogy leírja a látni kívánt átalakulást.
Gyakorlati eset: ha valaki fel akar próbálni egy kiegészítőt anélkül, hogy fizikailag felvenné, elég, ha készítsen egy fotót a témáról és egy másik a cikkből; a mesterséges intelligencia képes mindkettőt kombinálni, és megmutatni, hogyan nézne ki. A teljes munkafolyamat a Lensben koncentrálódik, így a gyors szerkesztési feladatokhoz nem kell elhagyni a böngészőt.
Ez az integráció először a következő időszakban aktiválódik: angolul, mind Androidon, mind iOS-en, és a Google jelzi, hogy fokozatosan terjeszkedik majd további piacokra és nyelvekre.
NotebookLM: Videóstílusok és összefoglalók vizuális támogatással
A NotebookLM-ben a Nano Banana a háttérben dolgozik a ... gazdagításán. Videós áttekintések felhasználó által hozzáadott forrásokból származó, kontextus szerint generált képekkel. Az eszköz hat kreatív stílust tartalmaz, és lehetővé teszi a videó formátumának beállítását.
- stílusok: akvarell, anime, papírművészet, rajzok, tábla, retró nyomat és örökség.
- formátumokegy részletesebb videó („Magyarázat”) és egy rövid („Rövid összefoglaló”).
A cél a vizuális magyarázatok hasznosabb és a kontextusnak megfelelőbb, olyan illusztrációkkal, amelyek nem korlátozódnak általános stockfotókra, hanem a platformra feltöltött dokumentumok tényleges tartalmát tükrözik.
Google Fotók: Mi várható?
A Google bejelentette, hogy megérkezik a Fotók között a következő hetekben. Bár részleteket nem közöltek, az elképzelés az, hogy a felhasználók közvetlenül a könyvtárból szerkeszthetik és javíthatják képeiket, kombinálhatják a felvételeket, vagy javíthatják portréikat az alkalmazás elhagyása nélkül.
Ár, csomagok és elérhetőség
A nagyközönség számára a Nano Banana használható ingyenes a Gemini alkalmazásból mobilon és weben. Egyszerűen töltsön fel egy fotót, és adja meg a kívánt utasításokat a tartalom gyors létrehozásához vagy szerkesztéséhez.
Professzionális használat esetén a hozzáférést a Google AI Studio és a Vertex AI biztosítja, használatalapú számlázással: millió token 30 dollárért (ez egy olyan referenciaérték, amelyet a Google nagyjából 0,039 eurónak felel meg létrehozott képenként, a költségpéldák alapján). Egyes csomagok, mint például a Google AI Pro, magas napi szerkesztési kvótákat tartalmaznak.
A kibővített elérhetőség megkezdődött az Egyesült Államokban, és a vállalat szerint a bevezetés kiterjed majd a következőre is: több ország és nyelvEközben a Lens Létrehozási módja fokozatosan bővülni fog, és további funkciókat és fejlesztéseket is kapunk.
Gyakorlati felhasználások, korlátok és biztonság
A nulláról való alkotás mellett a mesterséges intelligencia is remekel komplex kiadások például régi fényképek helyreállítása, egy jelenet hangulatának megváltoztatása vagy egy személy identitásának megőrzése többszöri átalakítás után. A képeket egyesítheti, valamint módosíthatja a megvilágítást és a perspektívát az egységes eredmény elérése érdekében.
Mint minden generatív mesterséges intelligenciában, előfordulhatnak a promptok félreértelmezései vagy tökéletlen eredményeket. A pontosság a részletes utasításokkal és az egymást követő iterációkkal javul; sőt, a rendszer megjegyzi a képállapotot, hogy egymást követően alkalmazhassa a változtatásokat. A SynthID és a továbbfejlesztett metaadatok bevezetése a visszaélések kockázatának csökkentését és a létrehozott tartalom azonosításának megkönnyítését célozza.
A szövegvezérelt szerkesztés, a népszerű termékekbe való közvetlen integráció és a nyomon követhetőség kombinációja teszi a Nano Bananát célponttá, hogy a Google ökoszisztéma releváns részévé váljon. A Search, a Lens, a NotebookLM és a Photos-ban való jövőbeni megjelenése révén a rögzítés és az alkotás közötti határ lerövidül, és a munkafolyamat a következőkhöz igazodik: megbízható és gyors képeket készít mindenki számára elérhető közelségben van.
