eval-pipeline

Name: eval-pipeline
Author: pablo90salgado

Diseña y ejecuta pipelines de evaluación para modelos y agentes de IA. Construye benchmarks, computa prompts, calcula la precisión y produce informes de comparación entre versiones.

0estrellas

Actualizado hace 2 meses

Ver en GitHub ↗

Cómo agregar

/plugin marketplace add pablo90salgado/eval-pipeline

El comando exacto puede variar según el repositorio. Consulta el README en GitHub.

Para el autor de la skill

Pega en el README de tu repo

Muestra que tu skill está catalogada en Skillteca, genera backlink y tráfico rastreable.

[![Listada na Skillteca](https://www.skillteca.com.br/api/badge/eval-pipeline/svg)](https://www.skillteca.com.br/skills/eval-pipeline?utm_source=badge&utm_medium=readme&utm_campaign=badge)

#ai

Skills relacionadas

Ver todas de Design e Frontend →

webapp-testing

143.8k

Kit de herramientas para interactuar y probar aplicaciones web locales usando Playwright. Permite verificar la funcionalidad del frontend, depurar el comportamiento de la UI, capturar capturas de pantalla del navegador y ver los registros del navegador.

Design e Frontend#testpor anthropics

brand-guidelines

143.8k

Aplica los colores y la tipografía oficiales de la marca Anthropic a cualquier artefacto que se beneficie de su identidad visual. Úselo cuando se apliquen pautas de estilo, formato visual o estándares de diseño de la empresa.

Design e Frontendpor anthropics

frontend-design

143.8k

Crea interfaces frontend distintivas y de grado de producción con alta calidad de diseño, generando código creativo y pulido y diseño de UI que evita la estética genérica de IA. Úsela para construir componentes web, páginas y aplicaciones, o para estilizar/embellecer UIs web.

Design e Frontend#css#aipor anthropics

web-artifacts-builder

143.8k

Suite de herramientas para crear artefactos HTML elaborados y multicomponente para claude.ai, utilizando tecnologías web frontend modernas (React, Tailwind CSS, shadcn/ui). Úselo para artefactos complejos que requieran gestión de estado, enrutamiento o componentes shadcn/ui, no para artefactos HTML/JSX simples de un solo archivo.

Design e Frontend#css#aipor anthropics

Alerta por categoría

Recibe nuevas skills de Design e Frontend todos los lunes

Un email corto con solo las skills nuevas de Design e Frontend. 4 minutos de lectura, sin spam, te das de baja con un clic.

Confirmas tu email en el primer envío. Sin spam. Te das de baja con un clic.

Eval Pipeline

Skill for measuring and comparing AI agent and model performance systematically.

When to use this skill

You want to know if a prompt change actually improved results
You need to compare two versions of an agent
You want to catch regressions before deploying changes
You need to report on agent quality with concrete metrics
You are building a dataset to fine-tune or test a model

Evaluation process

1. Define what you are measuring

Pick the right metric for

[Description truncada. Veja o README completo no GitHub.]

CompartirX LinkedIn

Comentarios · Sin comentarios

Entra para comentar. Entrar

Aún no hay comentarios. Sé el primero.