transcribe

Name: transcribe
Author: simonstrumse

VAD-first audio transcription pipeline with evidence-backed Whisper configuration, language-aware model routing, dictionary correction, and LLM post-processing. Use when the user wants to transcribe audio files — meetings, interviews, voice memos, podcasts. Handles Norwegian (NB-Whisper) and English (whisper-large-v3-turbo) with automatic language detection. Runs locally on Apple Silicon via MLX.

0estrelas

Atualizado há 5 meses

Ver no GitHub ↗Licença: MIT

Como adicionar

/plugin marketplace add simonstrumse/vibelabs-skills

O comando exato pode variar conforme o repositório. Confira o README no GitHub.

Para o autor da skill

Cole no README do seu repo

Mostra que sua skill está catalogada na Skillteca, gera backlink e tráfego rastreável.

[![Listada na Skillteca](https://www.skillteca.com.br/api/badge/transcribe-simonstrumse/svg)](https://www.skillteca.com.br/skills/transcribe-simonstrumse?utm_source=badge&utm_medium=readme&utm_campaign=badge)

#llm #test

Skills relacionadas

Ver todas de Pesquisa e Web →

understand-dashboard

64.4k1

Lance o painel web interativo para visualizar o grafo de conhecimento de uma base de código.

Pesquisa e Webpor Lum1104

understand-chat

64.4k

Use quando precisar fazer perguntas sobre uma base de código ou entender código usando um grafo de conhecimento.

Pesquisa e Webpor Lum1104

understand-domain

64.4k

Extrai conhecimento do domínio de negócio de uma base de código e gera um grafo interativo de fluxo de domínio. Funciona de forma autônoma (varredura leve) ou deriva de um grafo de conhecimento /understand existente.

Pesquisa e Web#aipor Lum1104

dev-browser

63k

Automatiza interações do navegador com estado de página persistente. Utilize para navegar em sites, preencher formulários, tirar capturas de tela, extrair dados da web, testar aplicativos ou automatizar fluxos de trabalho do navegador.

Pesquisa e Web#testpor code-yeongyu

Alerta por categoria

Receba novas skills de Pesquisa e Web toda segunda

1 email curto, só com as skills novas de Pesquisa e Web. 4 minutos de leitura, sem spam, cancela com 1 clique.

Você confirma o email no primeiro envio. Sem spam. Cancela com 1 clique.

Audio Transcription Pipeline

VAD-first, evidence-backed Whisper transcription running locally on Apple Silicon. Produces high-quality transcripts with zero hallucinations, correct domain terminology, and LLM-polished output.

Architecture: Audio → ffmpeg (16kHz WAV) → Silero-VAD (speech segmentation) → MLX Whisper → Dictionary replacement → Claude LLM correction → Output.

Prerequisites

macOS with Apple Silicon (M1/M2/M3/M4) — required for MLX
Python 3.9+ — Xcode Python at `/L

[Description truncada. Veja o README completo no GitHub.]

CompartilharX LinkedIn

Comentários · Nenhum comentário

Ainda não há comentários. Seja o primeiro.