← Voltar para o catálogo

training-llms-megatron

Treina grandes modelos de linguagem (2B-462B parâmetros) usando NVIDIA Megatron-Core com estratégias avançadas de paralelismo. É ideal para modelos com mais de 1B de parâmetros, máxima eficiência de GPU (47% MFU em H100) ou que exigem paralelismo de tensor/pipeline/sequência/contexto/especialista, sendo uma estrutura pronta para produção usada por Nemotron, LLaMA e DeepSeek.

9.1kestrelas
Atualizado há 2 meses

Ver no GitHub ↗Licença: MIT

Como adicionar

/plugin marketplace add Orchestra-Research/AI-Research-SKILLs

O comando exato pode variar conforme o repositório. Confira o README no GitHub.

Para o autor da skill

Cole no README do seu repo

Mostra que sua skill está catalogada na Skillteca, gera backlink e tráfego rastreável.

Listada na Skillteca
[![Listada na Skillteca](https://www.skillteca.com.br/api/badge/training-llms-megatron/svg)](https://www.skillteca.com.br/skills/training-llms-megatron?utm_source=badge&utm_medium=readme&utm_campaign=badge)

Alerta por categoria

Receba novas skills de Pesquisa e Web toda segunda

1 email curto, só com as skills novas de Pesquisa e Web. 4 minutos de leitura, sem spam, cancela com 1 clique.

Você confirma o email no primeiro envio. Sem spam. Cancela com 1 clique.

CompartilharXLinkedIn

Comentários · Nenhum comentário

Entre para comentar. Entrar

  • Ainda não há comentários. Seja o primeiro.