nano-banana

Genera imagenes fotorrealistas, renders de producto, concept art y mas usando los modelos Nano Banana de Google (sobre Gemini). Soporta text-to-image, image editing y multiples resoluciones hasta 4K.


Triggers

Frases que activan el skill
“generar imagen”
“render”
“nano banana”
“gemini image”
“text to image”
“editar imagen”
“product shot”
“crear foto”
“imagen con IA”

Prerequisitos

  • API key de Google AI Studio en .env como GOOGLE_AI_KEY
  • Billing vinculado al proyecto en Google Cloud (no cobra, activa quotas)
  • Sin dependencias adicionales (scripts usan curl + python3 stdlib)

Modelos

Modelo Model ID Uso
Nano Banana gemini-2.5-flash-image Legacy, prototipado rapido
Nano Banana Pro gemini-3-pro-image-preview Max calidad, Thinking mode, hasta 4K
Nano Banana 2 (default) gemini-3.1-flash-image-preview Calidad Pro a velocidad Flash

Quick Example

API_KEY=$(grep GOOGLE_AI_KEY .env | cut -d= -f2) && \
curl -s "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
  -H "Content-Type: application/json" \
  -H "X-goog-api-key: ${API_KEY}" \
  -d '{
    "contents": [{"parts": [{"text": "Generate an image: A ceramic mug on marble, studio lighting"}]}],
    "generationConfig": {"responseModalities": ["TEXT", "IMAGE"]}
  }' | python3 -c "
import json, base64, sys
data = json.load(sys.stdin)
for part in data['candidates'][0]['content']['parts']:
    if 'inlineData' in part:
        with open('mug.png', 'wb') as f:
            f.write(base64.b64decode(part['inlineData']['data']))
        print('OK: mug.png')
"

Capabilities

  • Text-to-image: prompt en ingles -> imagen fotorrealista
  • Image editing: imagen + instruccion -> imagen modificada
  • Multi-turn editing: ediciones encadenadas (hasta 3-4 turnos)
  • Aspect ratios: 14 opciones (1:1, 4:3, 16:9, 9:16, etc.)
  • Resolucion: hasta 4K con Nano Banana Pro
  • Batch: hasta 4 imagenes por request
  • SDKs: bash/curl, Node.js (@google/genai), Python (google-genai)

Estructura del Skill

skills/nano-banana/
├── SKILL.md                          # Workflow principal
└── references/
    ├── model-guide.md                # Comparativa de modelos, pricing
    ├── api-usage.md                  # Scripts bash, Node.js, Python
    ├── prompting-guide.md            # Keywords, estructura, tips
    ├── image-editing.md              # Workflow de edicion
    └── prompt-templates.md           # Templates por tipo de contenido

Integracion con furniture-planner

El skill furniture-planner usa nano-banana en su Fase 7 (Render opcional) para generar visualizaciones de muebles. Los templates especificos de muebles (texturas de materiales, keywords por tipo) se mantienen en furniture-planner/references/render-prompts.md.