nano-banana
Genera imagenes fotorrealistas, renders de producto, concept art y mas usando los modelos Nano Banana de Google (sobre Gemini). Soporta text-to-image, image editing y multiples resoluciones hasta 4K.
Triggers
| Frases que activan el skill |
|---|
| “generar imagen” |
| “render” |
| “nano banana” |
| “gemini image” |
| “text to image” |
| “editar imagen” |
| “product shot” |
| “crear foto” |
| “imagen con IA” |
Prerequisitos
- API key de Google AI Studio en
.envcomoGOOGLE_AI_KEY - Billing vinculado al proyecto en Google Cloud (no cobra, activa quotas)
- Sin dependencias adicionales (scripts usan curl + python3 stdlib)
Modelos
| Modelo | Model ID | Uso |
|---|---|---|
| Nano Banana | gemini-2.5-flash-image | Legacy, prototipado rapido |
| Nano Banana Pro | gemini-3-pro-image-preview | Max calidad, Thinking mode, hasta 4K |
| Nano Banana 2 (default) | gemini-3.1-flash-image-preview | Calidad Pro a velocidad Flash |
Quick Example
API_KEY=$(grep GOOGLE_AI_KEY .env | cut -d= -f2) && \
curl -s "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-image-preview:generateContent" \
-H "Content-Type: application/json" \
-H "X-goog-api-key: ${API_KEY}" \
-d '{
"contents": [{"parts": [{"text": "Generate an image: A ceramic mug on marble, studio lighting"}]}],
"generationConfig": {"responseModalities": ["TEXT", "IMAGE"]}
}' | python3 -c "
import json, base64, sys
data = json.load(sys.stdin)
for part in data['candidates'][0]['content']['parts']:
if 'inlineData' in part:
with open('mug.png', 'wb') as f:
f.write(base64.b64decode(part['inlineData']['data']))
print('OK: mug.png')
"
Capabilities
- Text-to-image: prompt en ingles -> imagen fotorrealista
- Image editing: imagen + instruccion -> imagen modificada
- Multi-turn editing: ediciones encadenadas (hasta 3-4 turnos)
- Aspect ratios: 14 opciones (1:1, 4:3, 16:9, 9:16, etc.)
- Resolucion: hasta 4K con Nano Banana Pro
- Batch: hasta 4 imagenes por request
- SDKs: bash/curl, Node.js (@google/genai), Python (google-genai)
Estructura del Skill
skills/nano-banana/
├── SKILL.md # Workflow principal
└── references/
├── model-guide.md # Comparativa de modelos, pricing
├── api-usage.md # Scripts bash, Node.js, Python
├── prompting-guide.md # Keywords, estructura, tips
├── image-editing.md # Workflow de edicion
└── prompt-templates.md # Templates por tipo de contenido
Integracion con furniture-planner
El skill furniture-planner usa nano-banana en su Fase 7 (Render opcional) para generar visualizaciones de muebles. Los templates especificos de muebles (texturas de materiales, keywords por tipo) se mantienen en furniture-planner/references/render-prompts.md.