Autor en el catálogo

EvXata

6 skills6 estrellas en totalgithub.com/EvXata

Skills publicadas

pipeline-eval

Un marco de evaluación a nivel de sistema para pipelines LLM multi-etapa, que califica el pipeline en su conjunto en 8 dimensiones, incluyendo calidad de entrada/salida y diseño de prompt. Complementa a `deepeval` al evaluar la arquitectura del pipeline en sí, en lugar de artefactos de contenido únicos.

Design e Frontend#llmpor EvXata

pipeline-eval

Un marco de evaluación a nivel de sistema para pipelines LLM multi-etapa, que puntúa el pipeline en su conjunto en 8 dimensiones, incluyendo calidad de entrada/salida y diseño de prompt. Complementa `deepeval` al evaluar la arquitectura del pipeline en sí.

Design e Frontend#llmpor EvXata

deepeval

Un marco de evaluación calibrado por BCG para las salidas de agentes LLM, con un juez nativo de Claude y una pila de 4 niveles. Incluye una rúbrica BCG de 8 dimensiones, una pila de novedad de 10 señales y un Agente Escéptico adversarial, diseñado para cadencias diarias, semanales o de 30 días e integrable en cualquier proyecto de Claude Code sin claves API.

Design e Frontend#llm#apipor EvXata

pipeline-eval

Un framework de evaluación a nivel de sistema para pipelines LLM multi-etapa, que puntúa el pipeline en su conjunto en 8 dimensiones, incluyendo calidad de entrada/salida, diseño de prompt y fundamentación de hechos. Complementa a `deepeval` al evaluar la arquitectura del pipeline en lugar de artefactos de contenido únicos.

Design e Frontend#llmpor EvXata

deepeval

Un marco de evaluación calibrado por BCG para salidas de agentes LLM, con un juez nativo de Claude (sin API externa). Incluye una pila de 4 niveles con rúbrica BCG de 8 dimensiones y un Agente Escéptico adversarial, integrándose en cualquier proyecto de Claude Code sin claves API.

Design e Frontend#llm#apipor EvXata

deepeval

Un marco de evaluación calibrado por BCG para las salidas de agentes LLM, que cuenta con un juez nativo de Codex y una pila de 4 niveles con una rúbrica BCG de 8 dimensiones y una pila de novedad de 10 señales. Incluye un Agente Escéptico adversarial para sondas de adulación y ambigüedad, soporta cadencias diarias/semanales/30 días y se integra en cualquier proyecto Codex sin claves de API.

Design e Frontend#llm#apipor EvXata

Alerta por categoría

Skills publicadas

pipeline-eval

pipeline-eval

deepeval

pipeline-eval

deepeval

deepeval

Recibe nuevas skills de Design e Frontend todos los lunes