eval

Name: eval
Rating: 5 (1 reviews)
Author: croftspan

Test whether your assembled context actually improves AI output. Runs tasks bare vs assembled, uses comparative judging, reports the delta. Use gigo:eval when you want to prove your setup works or debug why it doesn't.

1estrellas

Actualizado hace 2 meses

Ver en GitHub ↗Licencia: Apache-2.0

Cómo agregar

/plugin marketplace add croftspan/gigo

El comando exacto puede variar según el repositorio. Consulta el README en GitHub.

Para el autor de la skill

Pega en el README de tu repo

Muestra que tu skill está catalogada en Skillteca, genera backlink y tráfico rastreable.

[![Listada na Skillteca](https://www.skillteca.com.br/api/badge/eval-croftspan/svg)](https://www.skillteca.com.br/skills/eval-croftspan?utm_source=badge&utm_medium=readme&utm_campaign=badge)

#ai #test

Skills relacionadas

Ver todas de Desenvolvimento →

claude-api

143.8k

Build, debug, and optimize Claude API / Anthropic SDK apps. Apps built with this skill should include prompt caching. Also handles migrating existing Claude API code between Claude model versions (4.5 → 4.6, 4.6 → 4.7, retired-model replacements). TRIGGER when: code imports `anthropic`/`@anthropic-ai/sdk`; user asks for the Claude API, Anthropic SDK, or Managed Agents; user adds/modifies/tunes a C

Desenvolvimento#ai#apipor anthropics

skill-creator

143.8k

Cree nuevas habilidades, modifique y mejore las existentes, y mida su rendimiento. Se utiliza para desarrollar, editar, optimizar, probar y comparar habilidades, así como para refinar sus descripciones para una mejor precisión de activación.

Desenvolvimento#testpor anthropics

oh-my-issues

79.7k

Esta habilidad agrupa los backlogs de issues de GitHub por causa raíz en issues maestras de plan, redirige las issues relacionadas y agrupa los PRs de corrección arquitectónica para cerrar clusters atómicamente. Es ideal para clasificar y consolidar numerosas issues que comparten defectos subyacentes, o para construir una serie de planes o una hoja de ruta.

Desenvolvimento#github#gitpor thedotmack

claude-mem

79.7k

Captura las acciones de su agente entre sesiones, las comprime con IA e inyecta contexto relevante en interacciones futuras. Compatible con Claude Code, OpenClaw, Codex, Gemini, Hermes, Copilot, OpenCode y más.

Desenvolvimento#aipor thedotmack

Alerta por categoría

Recibe nuevas skills de Desenvolvimento todos los lunes

Un email corto con solo las skills nuevas de Desenvolvimento. 4 minutos de lectura, sin spam, te das de baja con un clic.

Confirmas tu email en el primer envío. Sin spam. Te das de baja con un clic.

Eval

Test whether assembled context actually improves output. Not part of the automatic pipeline — this is an opt-in diagnostic tool for teams that want evidence, not vibes.

When to Use

After running gigo:gigo — does the assembled context actually help?
When output quality seems inconsistent — is context helping or hurting?
When adding new personas — did they improve planning?
When debugging — is the Persona Calibration heuristic working?

Two Modes

Pipeline Eval (defau

[Description truncada. Veja o README completo no GitHub.]

CompartirX LinkedIn

Comentarios · Sin comentarios

Entra para comentar. Entrar

Aún no hay comentarios. Sé el primero.