turboquant

Name: turboquant
Rating: 5 (4 reviews)
Author: Ryuketsukami

Esta skill implementa, usa o explica TurboQuant, el algoritmo de cuantificación vectorial data-oblivious de Google para la compresión de caché KV de LLMs. Es aplicable para temas como la compresión de caché KV, TurboQuant y la reducción del uso de memoria de LLMs.

4estrellas

Actualizado hace 3 meses

Ver en GitHub ↗Licencia: MIT

Cómo agregar

/plugin marketplace add Ryuketsukami/turboquant-skill

El comando exacto puede variar según el repositorio. Consulta el README en GitHub.

Para el autor de la skill

Pega en el README de tu repo

Muestra que tu skill está catalogada en Skillteca, genera backlink y tráfico rastreable.

[![Listada na Skillteca](https://www.skillteca.com.br/api/badge/turboquant/svg)](https://www.skillteca.com.br/skills/turboquant?utm_source=badge&utm_medium=readme&utm_campaign=badge)

#llm #ai

Skills relacionadas

Ver todas de Dados e Análise →

xlsx

143.8k

Utilice esta habilidad para cualquier tarea que involucre archivos de hoja de cálculo como entrada o salida principal, como abrir, leer, editar, corregir, crear o convertir archivos .xlsx, .xlsm, .csv o .tsv.

Dados e Análise#xlsxpor anthropics

mem-search

79.7k

Busca en la base de datos de memoria persistente entre sesiones de claude-mem. Úselo para responder preguntas sobre soluciones anteriores o recuperar trabajo de sesiones pasadas.

Dados e Análise#aipor thedotmack

weekly-digests

79.7k

Genera un resumen narrativo semanal de la línea de tiempo Claude-mem de un proyecto, dividiéndola en archivos por semana ISO y utilizando subagentes para producir capítulos semanales. Ideal para "resúmenes semanales" o "capítulos narrativos" del historial de un proyecto.

Dados e Análise#aipor thedotmack

how-it-works

79.7k

Esta habilidad explica cómo claude-mem captura observaciones, cuándo se activa la inyección de memoria y dónde residen sus datos.

Dados e Análise#aipor thedotmack

Alerta por categoría

Recibe nuevas skills de Dados e Análise todos los lunes

Un email corto con solo las skills nuevas de Dados e Análise. 4 minutos de lectura, sin spam, te das de baja con un clic.

Confirmas tu email en el primer envío. Sin spam. Te das de baja con un clic.

TurboQuant — KV Cache Compression Skill

A skill for implementing, using, and explaining Google's TurboQuant algorithm — a data-oblivious vector quantization framework that achieves 6x memory reduction and up to 8x speedup for LLM KV caches with zero accuracy loss.

What TurboQuant Does

TurboQuant compresses the key-value (KV) cache in transformer-based LLMs. During inference, the KV cache grows linearly with sequence length and becomes the primary memory bottleneck for long-context genera

[Description truncada. Veja o README completo no GitHub.]

CompartirX LinkedIn

Comentarios · Sin comentarios

Entra para comentar. Entrar

Aún no hay comentarios. Sé el primero.