← Volver al catálogo

optimizing-attention-flash

Optimizes transformer attention with Flash Attention for 2-4x speedup and 10-20x memory reduction. Use when training/running transformers with long sequences (>512 tokens), encountering GPU memory issues with attention, or need faster inference. Supports PyTorch native SDPA, flash-attn library, H100 FP8, and sliding window attention.

7estrellas
Actualizado hace 2 meses

Ver en GitHub ↗Licencia: MIT

Cómo agregar

/plugin marketplace add braxtonROSE4/zorro-agent

El comando exacto puede variar según el repositorio. Consulta el README en GitHub.

Para el autor de la skill

Pega en el README de tu repo

Muestra que tu skill está catalogada en Skillteca, genera backlink y tráfico rastreable.

Listada na Skillteca
[![Listada na Skillteca](https://www.skillteca.com.br/api/badge/optimizing-attention-flash-braxtonrose4/svg)](https://www.skillteca.com.br/skills/optimizing-attention-flash-braxtonrose4?utm_source=badge&utm_medium=readme&utm_campaign=badge)

Skills relacionadas

Ver todas de Outros

Alerta por categoría

Recibe nuevas skills de Outros todos los lunes

Un email corto con solo las skills nuevas de Outros. 4 minutos de lectura, sin spam, te das de baja con un clic.

Confirmas tu email en el primer envío. Sin spam. Te das de baja con un clic.

CompartirXLinkedIn

Comentarios · Sin comentarios

Entra para comentar. Entrar

  • Aún no hay comentarios. Sé el primero.