Autor no catálogo

Ryuketsukami

1 skill4 estrelas no totalgithub.com/Ryuketsukami

Skills publicadas

turboquant

Esta skill implementa, usa ou explica o TurboQuant, algoritmo de quantização vetorial data-oblivious do Google para compressão de cache KV de LLMs. É aplicável para tópicos como compressão de cache KV, TurboQuant e redução do uso de memória de LLMs.

Dados e Análise#llm#aipor Ryuketsukami

Alerta por categoria

Skills publicadas

turboquant

Receba novas skills de Dados e Análise toda segunda