← Volver al catálogo

slime-rl-training

Provides guidance for LLM post-training with RL using slime, a Megatron+SGLang framework. Use when training GLM models, implementing custom data generation workflows, or needing tight Megatron-LM integration for RL scaling.

7estrellas
Actualizado hace 2 meses

Ver en GitHub ↗Licencia: MIT

Cómo agregar

/plugin marketplace add braxtonROSE4/zorro-agent

El comando exacto puede variar según el repositorio. Consulta el README en GitHub.

Para el autor de la skill

Pega en el README de tu repo

Muestra que tu skill está catalogada en Skillteca, genera backlink y tráfico rastreable.

Listada na Skillteca
[![Listada na Skillteca](https://www.skillteca.com.br/api/badge/slime-rl-training-braxtonrose4/svg)](https://www.skillteca.com.br/skills/slime-rl-training-braxtonrose4?utm_source=badge&utm_medium=readme&utm_campaign=badge)

Skills relacionadas

Ver todas de Automação

Alerta por categoría

Recibe nuevas skills de Automação todos los lunes

Un email corto con solo las skills nuevas de Automação. 4 minutos de lectura, sin spam, te das de baja con un clic.

Confirmas tu email en el primer envío. Sin spam. Te das de baja con un clic.

CompartirXLinkedIn

Comentarios · Sin comentarios

Entra para comentar. Entrar

  • Aún no hay comentarios. Sé el primero.