Skill: Investigación Recursiva Profunda (v2.0)

Investigación auto-regulada que itera hasta alcanzar nivel PhD sobre una semilla de investigación (tema raíz). Funciona en cualquier dominio: ciencias formales, naturales, sociales, humanidades, artes, tecnología, negocio.

Cuándo usar

Quieres profundizar en un tema hasta el nivel de un experto
Necesitas entender un campo nuevo para tomar decisiones informadas
Preparas un documento técnico, paper, propuesta o estudio
Quieres identificar estado del arte + gaps de conocimiento

Principios

Pregunta antes de investigar — la skill interroga al usuario sobre semilla, modo y fuentes ANTES de arrancar
Fuentes confiables con tiering transparente — rechaza automáticamente fuentes no fiables
WDM + Inversión Munger en toda decisión autónoma no trivial
Loop con auto-regulación — no iteraciones fijas; criterio medible para cerrar
Checkpointing defensivo — guarda a disco cada ciclo; sobrevive compact / cierre de sesión
Pausa preventiva — detecta proximidad al límite de contexto y sugiere pausar antes del cierre forzoso

Flujo completo

Fase 0 — Preguntas iniciales (la skill interroga)

Al invocar /recursive-research, la skill pregunta al usuario, en orden:

Semilla de investigación: "¿Cuál es el tema que quieres investigar?" (texto libre)
Modo: web / local / mixto
Si incluye local: "¿Qué rutas locales debo investigar?" (lista de paths separados por comas)
Fuentes priorizadas (opcional): autores, dominios, publicaciones preferidas
Fuentes excluidas (opcional)
Tope duro de ciclos (default: 20; configurable)

La skill presenta un resumen y espera confirmación antes de arrancar.

Fase 1 — Preparación del espacio de trabajo

Generar slug de la semilla (kebab-case, máx. 40 caracteres)
Verificar / crear memoria/investigaciones/<slug>/ en el directorio de trabajo actual
- Si memoria/ NO existe, crearla explicando: "No existe la carpeta memoria/ en el proyecto. La creo porque la skill necesita consolidar hallazgos en disco cada ciclo — es lo que permite reanudar la investigación en sesiones nuevas."
Crear archivos iniciales:
- estado.md — metadatos, progreso, métricas
- hilos.md — árbol de hilos semilla + sub-hilos
- fuentes-tier-1.md, fuentes-tier-2.md, fuentes-tier-3.md, fuentes-rechazadas.md
- hallazgos.md — consolidación

Fase 2 — Identificar hilos semilla

Generar 3-5 hilos semilla (ángulos distintos del tema).

Aplicar WDM a la selección de hilos:

Criterio	Peso	Qué evalúa
Cobertura conceptual	4	¿Cubre una dimensión distinta del tema?
Diversidad de perspectivas	3	¿Trae voces / escuelas distintas?
Accesibilidad de fuentes	3	¿Existen fuentes Tier 1/2 para este hilo?
Relevancia al usuario	4	¿Alinea con el objetivo que motivó la investigación?

Evaluar 5-8 hilos candidatos, seleccionar top 3-5.

Inversión Munger sobre los hilos elegidos:

¿Qué hilo importante estoy ignorando?
¿Qué perspectiva ausente haría que mi investigación sea parcial?
¿Qué escuela / voz disidente no aparece?

Si la inversión revela un hilo crítico faltante, agregarlo y re-ejecutar WDM.

Ejemplos por dominio (NO solo código):

Dominio	Semilla	Hilos típicos
Ciencia	Inmunoterapia contra cáncer	Mecanismos moleculares / Ensayos clínicos / Historia y evolución / Controversias y limitaciones / Estado comercial
Arte	Minimalismo en música del siglo XX	Compositores clave / Técnicas / Contexto histórico-cultural / Crítica y recepción / Obras emblemáticas
Negocio	Modelos de monetización SaaS B2B	Pricing strategies / Métricas financieras / Casos documentados / Marco legal / Psicología de compra B2B
Humanidades	Filosofía estoica aplicada moderna	Fuentes primarias (Epicteto, Séneca, Aurelio) / Interpretaciones contemporáneas / Aplicaciones prácticas / Críticas filosóficas / Evidencia empírica psicológica
Tecnología	Arquitectura hexagonal en microservicios	Fundamentos teóricos / Implementaciones por lenguaje / Casos reales / Trade-offs y críticas / Herramientas

Fase 3 — Detectar herramientas disponibles

Antes del primer ciclo, detectar MCPs disponibles y ordenar por preferencia:

Preferencia (mayor a menor velocidad/efectividad):

MCPs de scraping optimizados para IA: Firecrawl (firecrawl_scrape, firecrawl_crawl, firecrawl_search, firecrawl_extract) — texto estructurado, rápido
MCPs de documentación oficial: Context7 (query-docs) — cuando la fuente es una librería/framework
Herramientas nativas: WebSearch, WebFetch — fallback universal
MCPs de navegación real (Chrome DevTools): DESPRIORIZADOS — solo si el contenido requiere ejecución JS explícita (SPAs sin SSR, contenido tras auth)

Razón: scrapers de IA son 10-50× más rápidos que navegadores reales y dan texto ya estructurado.

Fase 4 — Fuentes semilla sugeridas

La skill presenta al usuario una lista de fuentes semilla pre-cargadas por dominio para que confirme, añada o rechace:

Ciencia general / papers:

arXiv (https://arxiv.org) — preprints en física, matemáticas, CS, biología, economía
Semantic Scholar (https://www.semanticscholar.org) — red de citaciones
Google Scholar (https://scholar.google.com)
Connected Papers (https://www.connectedpapers.com) — mapas visuales de citaciones
OpenReview (https://openreview.net) — revisiones abiertas en ML

Medicina / biología:

PubMed (https://pubmed.ncbi.nlm.nih.gov)
Cochrane Library (https://www.cochranelibrary.com) — meta-análisis
WHO (https://www.who.int)
ClinicalTrials.gov

Humanidades / ciencias sociales:

Código / tecnología:

GitHub (búsqueda, topics, starred lists de expertos)
Context7 para docs oficiales (si MCP disponible)
RFCs (https://www.rfc-editor.org)
W3C specs (https://www.w3.org/TR/)

Datos / estadística:

Banco Mundial (https://data.worldbank.org)
OECD Data (https://data.oecd.org)
Our World in Data (https://ourworldindata.org)
Pew Research (https://www.pewresearch.org)
Eurostat, INE, y equivalentes nacionales

Arte / cultura / humanidades:

Europeana (https://www.europeana.eu)
Google Arts & Culture (https://artsandculture.google.com)
Internet Archive (https://archive.org)
Project Gutenberg (https://www.gutenberg.org)

Generales:

Wikipedia — como PUNTO DE PARTIDA. Saltar siempre a la sección de referencias para llegar a Tier 1/2
Wikidata — datos estructurados

Fuentes locales (si el usuario proporcionó rutas):

Listar estructura de carpeta
Priorizar .md, .pdf, .txt, .doc/.docx, .html, .epub
Usar herramientas de lectura del agente (Read, Grep, Glob)

Fase 5 — Ciclo de investigación (LOOP auto-regulado)

Cada ciclo ejecuta los siguientes sub-pasos.

5.1. Elegir el hilo con menor cobertura

Calcular cobertura actual de cada hilo (hallazgos_registrados / hallazgos_esperados_proxy). Elegir el de menor %.

5.2. WDM + Munger sobre fuentes a usar en ESTE ciclo

WDM por fuente candidata:

Criterio	Peso	Escala
Autoridad (Tier)	5	Tier 1 = 5 · Tier 2 = 3 · Tier 3 = 2 · Rechazo = 0
Relevancia al hilo actual	5	1-5 por match semántico
Accesibilidad	3	5 = full text abierto · 3 = abstract + paywall · 1 = bloqueado
Recencia apropiada al campo	2	Código: reciente > viejo · Filosofía clásica: viejo = relevante
Ausencia de conflicto de interés	3	5 = independiente · 1 = financiada por parte interesada

Seleccionar top 3-5.

Inversión Munger sobre las fuentes seleccionadas:

¿Qué fuente NO estoy usando que debería? (disidentes, escuelas críticas, voces silencia

recursive-research

Cómo agregar

Pega en el README de tu repo

Skills relacionadas

dev-browser

agent-browser

understand-chat

understand-dashboard

Recibe nuevas skills de Pesquisa e Web todos los lunes