← Voltar para o catálogo

quantizing-models-bitsandbytes

Quantiza LLMs para 8 ou 4 bits, resultando em uma redução de memória de 50-75% com perda mínima de precisão. É ideal para GPU com memória limitada, modelos maiores ou inferência mais rápida, suportando formatos INT8, NF4, FP4, treinamento QLoRA e otimizadores de 8 bits, e funciona com HuggingFace Transformers.

9.1kestrelas
Atualizado há 2 meses

Ver no GitHub ↗Licença: MIT

Como adicionar

/plugin marketplace add Orchestra-Research/AI-Research-SKILLs

O comando exato pode variar conforme o repositório. Confira o README no GitHub.

Para o autor da skill

Cole no README do seu repo

Mostra que sua skill está catalogada na Skillteca, gera backlink e tráfego rastreável.

Listada na Skillteca
[![Listada na Skillteca](https://www.skillteca.com.br/api/badge/quantizing-models-bitsandbytes/svg)](https://www.skillteca.com.br/skills/quantizing-models-bitsandbytes?utm_source=badge&utm_medium=readme&utm_campaign=badge)

Alerta por categoria

Receba novas skills de Pesquisa e Web toda segunda

1 email curto, só com as skills novas de Pesquisa e Web. 4 minutos de leitura, sem spam, cancela com 1 clique.

Você confirma o email no primeiro envio. Sem spam. Cancela com 1 clique.

CompartilharXLinkedIn

Comentários · Nenhum comentário

Entre para comentar. Entrar

  • Ainda não há comentários. Seja o primeiro.