← Volver al catálogo

holdout-evaluator

Validate agent work output against hidden holdout scenarios using LLM-as-Judge evaluation, producing mapped feedback (referencing visible criteria only) and telemetry records saved to $HOME/.ai-first-kit/. Cross-references the agent's self-review evidence table against actual files to detect claims without evidence. Use when the user says 'validate holdouts', 'test gates against holdouts', 'run ho

5estrellas
Actualizado hace 14 días

Ver en GitHub ↗

Cómo agregar

/plugin marketplace add synaptiai/synapti-marketplace

El comando exacto puede variar según el repositorio. Consulta el README en GitHub.

Para el autor de la skill

Pega en el README de tu repo

Muestra que tu skill está catalogada en Skillteca, genera backlink y tráfico rastreable.

Listada na Skillteca
[![Listada na Skillteca](https://www.skillteca.com.br/api/badge/holdout-evaluator/svg)](https://www.skillteca.com.br/skills/holdout-evaluator?utm_source=badge&utm_medium=readme&utm_campaign=badge)

Alerta por categoría

Recibe nuevas skills de Pesquisa e Web todos los lunes

Un email corto con solo las skills nuevas de Pesquisa e Web. 4 minutos de lectura, sin spam, te das de baja con un clic.

Confirmas tu email en el primer envío. Sin spam. Te das de baja con un clic.

CompartirXLinkedIn

Comentarios · Sin comentarios

Entra para comentar. Entrar

  • Aún no hay comentarios. Sé el primero.