local-benchmarks

Descubre modelos locales (MLX/GGUF), los compara con benchmarks ya corridos, ejecuta nuevos con whatcanirun y opcionalmente sube resultados.

Triggers

Frases que activan el skill
“correr benchmarks” / “run benchmarks” / “benchmark local”
“whatcanirun”
“comparar modelos locales” / “compare local models”
“subir benchmark” / “submit benchmark” / “ver benchmarks”
“qué modelos tengo” / “modelos sin benchmark”
“listar modelos locales” / “list local models”
“benchmark performance”

Discovery: escanea las dos ubicaciones de modelos locales (MLX en cache de HuggingFace, GGUF) y presenta una tabla consolidada.
Comparación: cruza con benchmarks ya corridos para no repetir trabajo.
Ejecución: corre nuevos benchmarks con whatcanirun.
Submit (opcional): sube los resultados.

Regla principal: NO descargar modelos. Solo trabaja con lo que ya está descargado localmente.