Explorar skills

4845 skills encontradas

Alerta por categoría

Recibe nuevas skills de DevOps e Infra todos los lunes

ml-pipeline

Designs and implements production-grade ML pipeline infrastructure: configures experiment tracking with MLflow or Weights & Biases, creates Kubeflow or Airflow DAGs for training orchestration, builds feature store schemas with Feast, deploys model registries, and automates retraining and validation workflows. Use when building ML pipelines, orchestrating training workflows, automating model lifecy

DevOps e Infra#deploy#aipor Jeffallan

terraform-engineer

9.5k

Use when implementing infrastructure as code with Terraform across AWS, Azure, or GCP. Invoke for module development (create reusable modules, manage module versioning), state management (migrate backends, import existing resources, resolve state conflicts), provider configuration, multi-environment workflows, and infrastructure testing.

DevOps e Infra#ai#testpor Jeffallan

gguf-quantization

9.1k

Formato GGUF y cuantificación llama.cpp para inferencia eficiente en CPU/GPU. Úselo al implementar modelos en hardware de consumo, Apple Silicon, o cuando necesite cuantificación flexible de 2 a 8 bits sin requisitos de GPU.

DevOps e Infra#deploy#aipor Orchestra-Research

prompt-guard

9.1k

El detector de inyección de prompt y jailbreak de 86M de Meta filtra prompts maliciosos y datos de terceros para aplicaciones LLM. Ofrece más del 99% de TPR, menos del 1% de FPR, es rápido (<2ms GPU), multilingüe (8 idiomas) y puede implementarse con HuggingFace o procesamiento por lotes para la seguridad RAG.

DevOps e Infra#llm#deploypor Orchestra-Research

model-merging

9.1k

Fusiona múltiples modelos ajustados con mergekit para combinar capacidades sin reentrenar, ideal para crear modelos especializados al mezclar experiencia de dominio específico o mejorar el rendimiento. Cubre varias técnicas de fusión como SLERP, TIES-Merging, DARE, Task Arithmetic y fusión lineal, además de estrategias de despliegue en producción.

DevOps e Infra#deploy#aipor Orchestra-Research

nemo-evaluator-sdk

9.1k

La plataforma empresarial de NVIDIA evalúa LLMs en más de 100 benchmarks de más de 18 frameworks (MMLU, HumanEval, GSM8K, seguridad, VLM) con ejecución multi-backend. Ofrece evaluación escalable en Docker local, Slurm HPC o plataformas en la nube, con una arquitectura container-first para benchmarking reproducible.

DevOps e Infra#llm#aipor Orchestra-Research

modal-serverless-gpu

9.1k

Plataforma de nube GPU sin servidor para ejecutar cargas de trabajo de ML. Úsela cuando necesite acceso a GPU bajo demanda sin gestión de infraestructura, desplegar modelos de ML como APIs o ejecutar trabajos por lotes con escalado automático.

DevOps e Infra#deploy#aipor Orchestra-Research

llamaguard

9.1k

El modelo de moderación especializado de 7-8B de Meta filtra la entrada/salida de LLMs en 6 categorías de seguridad, como violencia/odio y contenido sexual, con una precisión del 94-95%. Se puede implementar con vLLM, HuggingFace, Sagemaker y se integra con NeMo Guardrails.

DevOps e Infra#llm#deploypor Orchestra-Research

fine-tuning-openvla-oft

9.1k

Ajusta y evalúa políticas OpenVLA-OFT y OpenVLA-OFT+ para la generación de acciones de robots con cabezales de acción continuos, adaptación LoRA y condicionamiento FiLM en simulaciones LIBERO y configuraciones reales ALOHA. Úselo para reproducir resultados del artículo OpenVLA-OFT, entrenar cabezales de acción VLA personalizados, implementar inferencia ALOHA cliente-servidor o depurar componentes como la normalización y la fusión LoRA.

DevOps e Infra#deploy#aipor Orchestra-Research

speculative-decoding

9.1k

Acelere la inferencia de LLMs utilizando decodificación especulativa, múltiples cabezas Medusa y técnicas de decodificación lookahead. Esto optimiza la velocidad de inferencia (aceleración de 1.5-3.6x), reduce la latencia para aplicaciones en tiempo real y es útil para desplegar modelos con computación limitada.

DevOps e Infra#llm#deploypor Orchestra-Research

knowledge-distillation

9.1k

Comprima grandes modelos de lenguaje utilizando destilación de conocimiento de modelos profesores a modelos estudiantes. Esta técnica es útil para implementar modelos más pequeños con rendimiento mantenido, transferir capacidades de GPT-4 a modelos de código abierto o reducir costos de inferencia, cubriendo estrategias como escalado de temperatura, soft targets, KLD inverso, destilación de logits y entrenamiento MiniLLM.

DevOps e Infra#llm#gitpor Orchestra-Research

wiki

5.8k

Claude + Obsidian knowledge companion. Sets up a persistent wiki vault, scaffolds structure from a one-sentence description, and routes to specialized sub-skills. Use for setup, scaffolding, cross-project referencing, and hot cache management. Triggers on: "set up wiki", "scaffold vault", "create knowledge base", "/wiki", "wiki setup", "obsidian vault", "knowledge base", "second brain setup", "run

DevOps e Infra#llm#aipor AgriciDaniel