Nano Banana: A Google képkészítő mesterséges intelligenciája kibővül a Search, a Lens és a NotebookLM szolgáltatásokra.

  • Integráció a Google Kereséssel a Lensen keresztül, „Létrehozás” móddal, hogy képeket generálhasson vagy szerkeszthessen új fotókból vagy a galériából.
  • A NotebookLM hat vizuális stílust és egy „Rövidet” ad hozzá a videóáttekintésekhez, mesterséges intelligencia által generált kontextuális illusztrációkkal.
  • Hamarosan a Google Fotókban is szerkesztheted és kombinálhatod a képeket anélkül, hogy elhagynád az alkalmazást.
  • Ingyenes használat a Gemini platformon és fizetős hozzáférés a Google AI Studio és a Vertex AI platformokon (kb. 30 USD/millió token).

Google mesterséges intelligencia képek készítéséhez

A Google szállít Google Nano Banán, a Gemini alkalmazáson túlmutató mesterséges intelligenciával vezérelt képgeneráló és -szerkesztő eszközét. A vállalat megkezdte az integrálását a Google Keresésbe a Lens és a NotebookLM segítségével, és azt is megerősítette, hogy hamarosan a Google Fotókba is érkezik.

A Gemini 2.5 Flash Image modellen alapuló mesterséges intelligencia a szöveges utasításokat vizuális eredményekké alakítja, amelyek megőrzik a karakterek és a stílus egységességét. A vállalat szerint a felhasználók már generáltak... több mint 5.000 milliárd kép, olyan termékekre vezetve be, amelyeket sokan nap mint nap használnak, kezdetben az Egyesült Államokban, majd a tervek szerint további nyelvekre és régiókra is kiterjesztik.

Mi az a nanobanán és hogyan működik?

Lényegében a Nano Banana értelmezi természetes nyelvi promptok képeket készíthet a semmiből, vagy precíz módosításokat alkalmazhat egy fotón. Módosíthatja a háttereket, beállíthatja a színeket, eltávolíthat tárgyakat vagy embereket, visszaállíthat régi képeket, kicsinyíthet, módosíthatja a kifejezéseket, és több felvételt egyetlen összefüggő jelenetbe egyesíthet.

Az egyik kulcsa az vizuális következetesség: Megőrzi az arcvonásokat és a tárgyak elrendezését több szerkesztés során is, ami különösen hasznos egy karakter vagy stílus több variációban való megőrzéséhez. Minél részletesebb a kérés, annál hűbb az eredmény.

A nyomonkövethetőség megerősítése érdekében a Google hozzáteszi SynthID (látható vízjel és digitális jel a metaadatokban) a létrehozott vagy szerkesztett képeken, segítve az ezzel a technológiával előállított tartalom azonosítását anélkül, hogy befolyásolná annak érzékelt minőségét.

Keresés és Google Lens: Alkoss és szerkessz a mobilodról

A Google alkalmazásban a Lens bemutatja a „Létrehozás” módInnen készíthetsz egy fotót, vagy választhatsz egyet a galériádból, és beírhatod az utasításokat, hogy a mesterséges intelligencia azonnal alkalmazhassa a módosításokat. Egyes eszközökön egy „Nano Banana Create” gomb jelenik meg a keresési és fordítási lehetőségek mellett, így gyorsan elérheted ezeket a funkciókat.

Tapasztalati útmutatók a típus példáival "Változtass bábuvá" vagy „Tegyél egy európai utcára”, és lehetővé teszi az elülső és a hátsó kamera közötti váltást a kérés elküldése előtt. A rögzítés után a kép hozzáadódik az AI mód szövegmezőjéhez, hogy leírja a látni kívánt átalakulást.

Gyakorlati eset: ha valaki fel akar próbálni egy kiegészítőt anélkül, hogy fizikailag felvenné, elég, ha készítsen egy fotót a témáról és egy másik a cikkből; a mesterséges intelligencia képes mindkettőt kombinálni, és megmutatni, hogyan nézne ki. A teljes munkafolyamat a Lensben koncentrálódik, így a gyors szerkesztési feladatokhoz nem kell elhagyni a böngészőt.

Ez az integráció először a következő időszakban aktiválódik: angolul, mind Androidon, mind iOS-en, és a Google jelzi, hogy fokozatosan terjeszkedik majd további piacokra és nyelvekre.

NotebookLM: Videóstílusok és összefoglalók vizuális támogatással

A NotebookLM-ben a Nano Banana a háttérben dolgozik a ... gazdagításán. Videós áttekintések felhasználó által hozzáadott forrásokból származó, kontextus szerint generált képekkel. Az eszköz hat kreatív stílust tartalmaz, és lehetővé teszi a videó formátumának beállítását.

  • stílusok: akvarell, anime, papírművészet, rajzok, tábla, retró nyomat és örökség.
  • formátumokegy részletesebb videó („Magyarázat”) és egy rövid („Rövid összefoglaló”).

A cél a vizuális magyarázatok hasznosabb és a kontextusnak megfelelőbb, olyan illusztrációkkal, amelyek nem korlátozódnak általános stockfotókra, hanem a platformra feltöltött dokumentumok tényleges tartalmát tükrözik.

Google Fotók: Mi várható?

A Google bejelentette, hogy megérkezik a Fotók között a következő hetekben. Bár részleteket nem közöltek, az elképzelés az, hogy a felhasználók közvetlenül a könyvtárból szerkeszthetik és javíthatják képeiket, kombinálhatják a felvételeket, vagy javíthatják portréikat az alkalmazás elhagyása nélkül.

Ár, csomagok és elérhetőség

A nagyközönség számára a Nano Banana használható ingyenes a Gemini alkalmazásból mobilon és weben. Egyszerűen töltsön fel egy fotót, és adja meg a kívánt utasításokat a tartalom gyors létrehozásához vagy szerkesztéséhez.

Professzionális használat esetén a hozzáférést a Google AI Studio és a Vertex AI biztosítja, használatalapú számlázással: millió token 30 dollárért (ez egy olyan referenciaérték, amelyet a Google nagyjából 0,039 eurónak felel meg létrehozott képenként, a költségpéldák alapján). Egyes csomagok, mint például a Google AI Pro, magas napi szerkesztési kvótákat tartalmaznak.

A kibővített elérhetőség megkezdődött az Egyesült Államokban, és a vállalat szerint a bevezetés kiterjed majd a következőre is: több ország és nyelvEközben a Lens Létrehozási módja fokozatosan bővülni fog, és további funkciókat és fejlesztéseket is kapunk.

Gyakorlati felhasználások, korlátok és biztonság

A nulláról való alkotás mellett a mesterséges intelligencia is remekel komplex kiadások például régi fényképek helyreállítása, egy jelenet hangulatának megváltoztatása vagy egy személy identitásának megőrzése többszöri átalakítás után. A képeket egyesítheti, valamint módosíthatja a megvilágítást és a perspektívát az egységes eredmény elérése érdekében.

Mint minden generatív mesterséges intelligenciában, előfordulhatnak a promptok félreértelmezései vagy tökéletlen eredményeket. A pontosság a részletes utasításokkal és az egymást követő iterációkkal javul; sőt, a rendszer megjegyzi a képállapotot, hogy egymást követően alkalmazhassa a változtatásokat. A SynthID és a továbbfejlesztett metaadatok bevezetése a visszaélések kockázatának csökkentését és a létrehozott tartalom azonosításának megkönnyítését célozza.

A szövegvezérelt szerkesztés, a népszerű termékekbe való közvetlen integráció és a nyomon követhetőség kombinációja teszi a Nano Bananát célponttá, hogy a Google ökoszisztéma releváns részévé váljon. A Search, a Lens, a NotebookLM és a Photos-ban való jövőbeni megjelenése révén a rögzítés és az alkotás közötti határ lerövidül, és a munkafolyamat a következőkhöz igazodik: megbízható és gyors képeket készít mindenki számára elérhető közelségben van.

Google Gemini Nano Banán
Kapcsolódó cikk:
A Google Gemini nanobanánja: az új képszerkesztő és -generáló motor