Guida Completa a Nano Banana Pro: 10 Consigli per la Produzione Professionale di Immagini
Nano-Banana Pro rappresenta un significativo passo avanti rispetto ai modelli della generazione precedente, passando dalla generazione di immagini “divertenti” alla produzione di asset professionali “funzionali”. Eccelle nel rendering del testo, nella coerenza dei personaggi, nella sintesi visiva, nella conoscenza del mondo (Search) e nell’output ad alta risoluzione (4K).
Dopo la guida per sviluppatori su come iniziare con AI Studio e le API, questa guida copre le capacità principali e come utilizzarle efficacemente tramite i prompt.
Nota: Questa guida è stata scritta da Guillaume Vernade, Gemini Developer Advocate, Google DeepMind. Ho deciso di tradurla e metterla sul mio sito, perchè lasciarla su twitter è uno spreco di contenuto potenzialmente utile. La cover inage è FATTA CON NANO BANANA PRO! Il testo è machine-translated ma revisionato da me :)
- Originale di Guillaume Vernade, Gemini Developer Advocate, Google DeepMind
- Traduzione e adattamento di Andrea Scarpetta , membro fondatore di Search Foundry searchfoundry.pro
Ecco cosa troverai in questo articolo:
- Le Regole d’Oro del Prompting
- Rendering del Testo, Infografiche e Sintesi Visiva
- Coerenza del Personaggio e Miniature Virali
- Grounding con Google Search
- Editing Avanzato, Restauro e Colorazione
- Traduzione Dimensionale (2D ↔ 3D)
- Alta Risoluzione e Texture
- Pensiero e Ragionamento
- Storyboarding One-Shot e Concept Art
- Controllo Strutturale e Guida al Layout
- E dopo?
🛑 Sezione 0: Le Regole d’Oro del Prompting
Nano-Banana Pro è un modello “Pensante”. Non si limita ad abbinare parole chiave perchè comprende l’intento, la fisica e la composizione. Per ottenere i migliori risultati, smetti di usare “sbrodolamenti di tag” (es. cane, parco, 4k, realistico) e inizia ad agire come un Direttore Creativo.
0A. Modifica, Non Rigenerare (Edit, Don’t Re-roll)
Il modello è molto bravo a comprendere le modifiche conversazionali. Se un’immagine è corretta all'80%, non generarne una nuova da zero. Invece, chiedi semplicemente la modifica specifica di cui hai bisogno.
Esempio: “È fantastico, ma cambia l’illuminazione in tramonto e rendi il testo blu neon.”
0B. Usa un Linguaggio Naturale e Frasi Complete
Parla al modello come se stessi dando istruzioni a un artista umano. Usa una grammatica corretta e aggettivi descrittivi.
❌ Male: “Auto di lusso, neon, città, notte, 8k.”
✅ Bene: “Un’inquadratura cinematografica ampia di un’auto sportiva futuristica che sfreccia attraverso una strada piovosa di Tokyo di notte. Le insegne al neon si riflettono sull’asfalto bagnato e sul telaio metallico dell’auto.”
0C. Sii Specifico e Descrittivo
I prompt vaghi producono risultati generici. Definisci il soggetto, l’ambientazione, l’illuminazione e l’atmosfera.
Soggetto: Invece di “una donna”, scrivi “una donna anziana sofisticata che indossa un tailleur stile Chanel vintage”.
Materialità: Descrivi le texture. “Finitura opaca”, “acciaio spazzolato”, “velluto morbido”, “carta stropicciata”.
0D. Fornisci il Contesto (Il “Perché” o “Per chi”)
Poiché il modello “pensa”, fornirgli il contesto lo aiuta a prendere decisioni artistiche logiche.
Esempio: “Crea un’immagine di un panino per un libro di cucina gourmet brasiliano di alta gamma.” (Il modello dedurrà un impiattamento professionale, una profondità di campo ridotta e un’illuminazione perfetta).
1. Rendering del Testo, Infografiche e Sintesi Visiva
Nano-Banana Pro ha capacità SOTA (State Of The Art) per il rendering di testo leggibile e stilizzato e per la sintesi di informazioni complesse in formati visivi.
Best Practices:
- Sintesi: Chiedi al modello di “riassumere” testo denso o PDF e farli diventare immagini di spiegazione.
- Stile: Specifica se vuoi un look “editoriale rifinito”, un “diagramma tecnico” o una “lavagna disegnata a mano”.
- Citazioni: Specifica chiaramente il testo che vuoi tra virgolette.
Esempi di Prompt:
Infografica Report Utili (Data Ingestion): [Input PDF dell’ultimo report sugli utili di Google] “Genera un’infografica pulita e moderna che riassuma i principali punti salienti finanziari da questo report sugli utili. Includi grafici per ‘Crescita dei Ricavi’ e ‘Utile Netto’, ed evidenzia la citazione chiave del CEO in un box citazione stilizzato.”
Provalo in AI Studio (Nota: Richiede il caricamento di un PDF)
Infografica Retrò: “Crea un’infografica in stile retrò anni ‘50 sulla storia del diner americano. Includi sezioni distinte per ‘Il Cibo’, ‘Il Jukebox’ e ‘L’Arredamento’. Assicurati che tutto il testo sia leggibile e stilizzato per adattarsi al periodo.”
Diagramma Tecnico: “Crea una planimetria ortografica che descriva questo edificio in pianta, prospetto e sezione. Etichetta chiaramente il ‘Prospetto Nord’ e l’‘Ingresso Principale’ con un font architettonico tecnico. Formato 16:9.”
Riassunto su Lavagna (Educational): “Riassumi il concetto di ‘Architettura della Rete Neurale Transformer’ come un diagramma disegnato a mano su una lavagna bianca adatto a una lezione universitaria. Usa pennarelli di colori diversi per i blocchi Encoder e Decoder, e includi etichette leggibili per ‘Self-Attention’ e ‘Feed Forward’.”
2. Coerenza del Personaggio e Miniature Virali
Nano-Banana Pro supporta fino a 14 immagini di riferimento (6 con alta fedeltà). Questo consente l’“Identity Locking” (blocco dell’identità), ovvero inserire una persona o un personaggio specifico in nuovi scenari senza distorsioni facciali.
Best Practices:
- Identity Locking: Dichiara esplicitamente: “Mantieni i tratti del viso della persona esattamente uguali all’Immagine 1.”
- Espressione/Azione: Descrivi il cambiamento di emozione o posa mantenendo l’identità.
- Composizione Virale: Combina soggetti con grafica audace e testo in un unico passaggio.
Esempi di Prompt:
La “Miniatura Virale” (Identità + Testo + Grafica): “Progetta una miniatura video virale usando la persona dell’Immagine 1. Coerenza del Viso: Mantieni i tratti del viso della persona esattamente uguali all’Immagine 1, ma cambia la sua espressione per sembrare eccitata e sorpresa. Azione: Metti in posa la persona sul lato sinistro, che punta il dito verso il lato destro dell’inquadratura. Soggetto: Sul lato destro, posiziona un’immagine di alta qualità di un delizioso toast all’avocado. Grafica: Aggiungi una freccia gialla audace che collega il dito della persona al toast. Testo: Sovrapponi un testo massiccio in stile pop al centro: ‘3 minuti e fatto!’ (Done in 3 mins!). Usa un contorno bianco spesso e un’ombra esterna. Sfondo: Uno sfondo cucina sfocato e luminoso. Alta saturazione e contrasto.”
Provalo in AI Studio (Nota: Richiede il caricamento di un’immagine di riferimento)
Lo Scenario “Amici Pelosi” (Coerenza di Gruppo): [Input 3 immagini di diverse creature di peluche] “Crea una storia divertente in 10 parti con questi 3 amici pelosi che vanno in vacanza ai tropici. La storia è avvincente dall’inizio alla fine con alti e bassi emotivi e termina in un momento felice. Mantieni l’abbigliamento e l’identità coerenti per tutti e 3 i personaggi, ma le loro espressioni e angolazioni dovrebbero variare in tutte le 10 immagini. Assicurati di avere solo uno di ogni personaggio in ogni immagine.”
Provalo in AI Studio (Nota: Richiede il caricamento di immagini di riferimento)
Generazione di Asset del Brand: [Input 1 immagine di un prodotto] “Crea 9 scatti di moda sbalorditivi come se provenissero da un editoriale di moda pluripremiato. Usa questo riferimento come stile del brand ma aggiungi sfumature e varietà alla gamma in modo che trasmettano un tocco di design professionale. Per favore genera nove immagini, una alla volta.”
Provalo in AI Studio (Nota: Richiede il caricamento di un’immagine di riferimento)
3. Grounding con Google Search
Nano-Banana Pro utilizza Google Search per generare immagini basate su dati in tempo reale, eventi attuali o verifiche fattuali, riducendo le allucinazioni su argomenti attuali.
nota di Andrea: è probabilmente lo stesso meccanismo che è stato integrato in notebookLM
Best Practices:
- Chiedi visualizzazioni di dati dinamici (meteo, azioni, notizie).
- Il modello “penserà” sui risultati della ricerca prima di generare l’immagine.
Esempi di Prompt:
Visualizzazione Eventi: “Genera un’infografica dei periodi migliori per visitare i Parchi Nazionali degli Stati Uniti nel 2025 basata sulle attuali tendenze di viaggio.”
4. Editing Avanzato, Restauro e Colorazione
Il modello eccelle in modifiche complesse tramite prompt conversazionali. Questo include “In-painting” (rimozione/aggiunta di oggetti), “Restauro” (correzione di vecchie foto), “Colorazione” (Manga/foto in B&N) e “Style Swapping” (scambio di stile).
Best Practices:
- Istruzioni Semantiche: Non è necessario mascherare manualmente le parti dell’immagine; chiedi semplicemente al modello cosa cambiare in modo naturale.
- Comprensione della Fisica: Puoi chiedere cambiamenti complessi come “riempi questo bicchiere di liquido” per testare la generazione della fisica.
Esempi di Prompt:
Rimozione Oggetti & In-painting: “Rimuovi i turisti dallo sfondo di questa foto e riempi lo spazio con texture logiche (ciottoli e vetrine) che si abbinino all’ambiente circostante.”
Provalo in AI Studio (Nota: Richiede il caricamento di una foto)
Colorazione Manga/Fumetti: [Input pannello manga in bianco e nero] “Colora questo pannello manga. Usa una palette vibrante in stile anime. Assicurati che gli effetti di luce sui raggi di energia siano blu neon brillante e che l’abbigliamento del personaggio sia coerente con i suoi colori ufficiali.”
Provalo in AI Studio (Nota: Richiede il caricamento di un’immagine)
Localizzazione (Traduzione Testo + Adattamento Culturale): [Input immagine di una pubblicità alla fermata dell’autobus di Londra] “Prendi questo concetto e localizzalo in un’ambientazione di Tokyo, includendo la traduzione dello slogan in giapponese. Cambia lo sfondo in una vivace strada di Shibuya di notte.”
Provalo in AI Studio (Nota: Richiede il caricamento di un’immagine)
Controllo Illuminazione/Stagionale: [Input immagine di una casa in estate] “Trasforma questa scena in inverno. Mantieni l’architettura della casa esattamente la stessa, ma aggiungi neve al tetto e al cortile, e cambia l’illuminazione in un pomeriggio freddo e nuvoloso.”
Provalo in AI Studio (Nota: Richiede il caricamento di un’immagine)
5. Traduzione Dimensionale (2D ↔ 3D)
Una nuova potente capacità è la traduzione di schemi 2D in visualizzazioni 3D, o viceversa. Questo è ideale per interior designer, architetti e creatori di meme.
Nota di Andrea: le conseguenze sui portali immobiliari sono difficili da valutare: porteranno ad un proliferare di immagini perfette. Non credo che sarà uno scenario positivo per chi fa delle fotografia il suo mestiere. Ci sarà anche un proliferare di immagini fasulle (ma belle) e poco realistiche, più di quanto già avviene con l’abuso delle foto grandangolari.
Esempi di Prompt:
Da Planimetria 2D a Tavola di Interior Design 3D: “Basandoti sulla planimetria 2D caricata, genera una tavola di presentazione di interior design professionale in un’unica immagine. Layout: Un collage con una grande immagine principale in alto (prospettiva grandangolare della zona giorno) e tre immagini più piccole in basso (Camera Padronale, Home Office e una planimetria 3D dall’alto). Stile: Applica uno stile Minimalista Moderno con pavimenti in legno di rovere caldo e pareti bianco sporco in TUTTE le immagini. Qualità: Rendering fotorealistico, illuminazione naturale morbida.”
Provalo in AI Studio (Nota: Richiede il caricamento di una planimetria)
Conversione Meme da 2D a 3D: “Trasforma il meme del cane ‘This is Fine’ in un render 3D fotorealistico. Mantieni la composizione identica ma fai sembrare il cane un peluche e il fuoco fiamme realistiche.”
6. Alta Risoluzione e Texture
Nano-Banana Pro supporta la generazione nativa di immagini da 1K a 4K. Questo è particolarmente utile per texture dettagliate o stampe di grande formato.
Best Practices:
- Richiedi esplicitamente alte risoluzioni (2K o 4K) se la tua API/Interfaccia lo consente.
- Descrivi dettagli ad alta fedeltà (imperfezioni, texture superficiali).
Esempi di Prompt:
Generazione Texture 4K: “Sfrutta l’output nativo ad alta fedeltà per creare un ambiente mozzafiato e atmosferico di un sottobosco muschioso. Comanda effetti di luce complessi e texture delicate, assicurando che ogni filo di muschio e raggio di luce sia reso con una risoluzione pixel-perfect adatta per uno sfondo 4K.”
Logica Complessa (Modalità Pensiero): “Crea un’infografica iper-realistica di un cheeseburger gourmet, decostruito per mostrare la consistenza del panino brioche tostato, la crosta scottata del patty e lo scioglimento scintillante del formaggio. Etichetta ogni strato con il suo profilo di sapore.”
7. Pensiero e Ragionamento
Nano-Banana Pro utilizza di default un processo di “Pensiero” in cui genera immagini di pensiero intermedie (non addebitate) per perfezionare la composizione prima di renderizzare l’output finale. Questo consente l’analisi dei dati e la risoluzione di problemi visivi senza dover fare diversi passaggi.
Esempi di Prompt:
Risolvi Equazioni: “Risolvi log_{x^2+1}(x^4-1)=2 in C su una lavagna bianca. Mostra i passaggi chiaramente.”
Ragionamento Visivo: “Analizza questa immagine di una stanza e genera un’immagine ‘prima’ che mostri come avrebbe potuto apparire la stanza durante la costruzione, mostrando l’intelaiatura e il cartongesso non finito.”
Provalo in AI Studio (Nota: Richiede il caricamento di un’immagine)
8. Storyboarding One-Shot e Concept Art
Puoi generare arte sequenziale o storyboard senza una griglia, garantendo un flusso narrativo coerente in un’unica sessione. Questo è anche popolare per la “Concept Art di Film” (es. falsi leak di film in uscita).
Esempio di Prompt:
“Crea una storia intrigante e avvincente in 9 parti con 9 immagini con protagonista una donna e un uomo in una pubblicità di valigie di lusso pluripremiata. La storia dovrebbe avere alti e bassi emotivi, terminando con un’elegante inquadratura della donna con il logo. L’identità della donna e dell’uomo e il loro abbigliamento devono rimanere coerenti per tutto il tempo, ma possono e devono essere visti da diverse angolazioni e distanze. Per favore genera le immagini una alla volta. Assicurati che ogni immagine sia in formato orizzontale 16:9.”
9. Controllo Strutturale e Guida al Layout
Le immagini di input non sono limitate a riferimenti di personaggi o soggetti da modificare. Puoi usarle per controllare rigorosamente la composizione e il layout dell’output finale. Questo è un punto di svolta per i designer che hanno bisogno di trasformare uno schizzo su un tovagliolo, un wireframe o un layout a griglia specifico in un asset rifinito.
Best Practices:
- Bozze & Schizzi: Carica uno schizzo disegnato a mano per definire esattamente dove dovrebbero trovarsi il testo e l’oggetto.
- Wireframe: Usa screenshot di layout esistenti o wireframe per generare mockup UI ad alta fedeltà.
- Griglie: Usa immagini a griglia per forzare il modello a generare asset per giochi basati su tile o display LED.
Esempi di Prompt:
Da Schizzo a Pubblicità Finale: “Crea una pubblicità per un [prodotto] seguendo questo schizzo.”
Nota di Andrea: Attenzione all’ortografia prodotta dallo strumento.
Provalo in AI Studio (Nota: Richiede il caricamento di uno schizzo)
Mockup UI da Wireframe: “Crea un mock-up per un [prodotto] seguendo queste linee guida.”
Nota di Andrea: questa funzionalità è particolarmente apparente nel progetto simil-Figma di Google, cioè Stitch, https://stitch.withgoogle.com/
Provalo in AI Studio (Nota: Richiede il caricamento di un wireframe)
Pixel Art & Display LED: “Genera uno sprite in pixel art di un unicorno che si adatti perfettamente a questa immagine a griglia 64x64. Usa colori ad alto contrasto.” (Suggerimento: Gli sviluppatori possono quindi estrarre programmaticamente il colore centrale di ogni cella per guidare un display a matrice LED 64x64 collegato).
Provalo in AI Studio (Nota: Richiede il caricamento di un’immagine a griglia)
Sprite: “Foglio sprite di una donna che fa un salto mortale all’indietro su un drone, griglia 3x3, sequenza, animazione fotogramma per fotogramma, rapporto d’aspetto quadrato. Segui esattamente la struttura dell’immagine di riferimento allegata..” (Suggerimento: Puoi quindi estrarre ogni cella e creare una gif)
10. E dopo?
Ora che hai padroneggiato le basi del prompting, ecco come puoi iniziare a costruire:
- Sperimenta nell’UI: Google AI Studio è il modo più veloce per testare prompt e parametri.
- Galleria App: Dai un’occhiata alle fantastiche app basate su Nano-banana nella App Gallery.
- Vibe-code: Trasforma il tuo miglior prompt in un’app che puoi condividere facilmente con i tuoi amici in AI Studio Build.
- Costruisci Applicazioni: Pronto a programmare? Dai un’occhiata alla guida per sviluppatori o al Gemini API Cookbook per guide e snippet di codice.
- Approfondimento Tecnico: Leggi la Documentazione API Gemini completa per dettagli su limiti di velocità, prezzi e integrazione.