Skill: Investigación Recursiva Profunda (v2.0)
Investigación auto-regulada que itera hasta alcanzar nivel PhD sobre una semilla de investigación (tema raíz). Funciona en cualquier dominio: ciencias formales, naturales, sociales, humanidades, artes, tecnología, negocio.
Cuándo usar
- Quieres profundizar en un tema hasta el nivel de un experto
- Necesitas entender un campo nuevo para tomar decisiones informadas
- Preparas un documento técnico, paper, propuesta o estudio
- Quieres identificar estado del arte + gaps de conocimiento
Principios
- Pregunta antes de investigar — la skill interroga al usuario sobre semilla, modo y fuentes ANTES de arrancar
- Fuentes confiables con tiering transparente — rechaza automáticamente fuentes no fiables
- WDM + Inversión Munger en toda decisión autónoma no trivial
- Loop con auto-regulación — no iteraciones fijas; criterio medible para cerrar
- Checkpointing defensivo — guarda a disco cada ciclo; sobrevive compact / cierre de sesión
- Pausa preventiva — detecta proximidad al límite de contexto y sugiere pausar antes del cierre forzoso
Flujo completo
Fase 0 — Preguntas iniciales (la skill interroga)
Al invocar /recursive-research, la skill pregunta al usuario, en orden:
- Semilla de investigación: "¿Cuál es el tema que quieres investigar?" (texto libre)
- Modo:
web/local/mixto - Si incluye local: "¿Qué rutas locales debo investigar?" (lista de paths separados por comas)
- Fuentes priorizadas (opcional): autores, dominios, publicaciones preferidas
- Fuentes excluidas (opcional)
- Tope duro de ciclos (default: 20; configurable)
La skill presenta un resumen y espera confirmación antes de arrancar.
Fase 1 — Preparación del espacio de trabajo
- Generar
slugde la semilla (kebab-case, máx. 40 caracteres) - Verificar / crear
memoria/investigaciones/<slug>/en el directorio de trabajo actual- Si
memoria/NO existe, crearla explicando: "No existe la carpetamemoria/en el proyecto. La creo porque la skill necesita consolidar hallazgos en disco cada ciclo — es lo que permite reanudar la investigación en sesiones nuevas."
- Si
- Crear archivos iniciales:
estado.md— metadatos, progreso, métricashilos.md— árbol de hilos semilla + sub-hilosfuentes-tier-1.md,fuentes-tier-2.md,fuentes-tier-3.md,fuentes-rechazadas.mdhallazgos.md— consolidación
Fase 2 — Identificar hilos semilla
Generar 3-5 hilos semilla (ángulos distintos del tema).
Aplicar WDM a la selección de hilos:
| Criterio | Peso | Qué evalúa |
|---|---|---|
| Cobertura conceptual | 4 | ¿Cubre una dimensión distinta del tema? |
| Diversidad de perspectivas | 3 | ¿Trae voces / escuelas distintas? |
| Accesibilidad de fuentes | 3 | ¿Existen fuentes Tier 1/2 para este hilo? |
| Relevancia al usuario | 4 | ¿Alinea con el objetivo que motivó la investigación? |
Evaluar 5-8 hilos candidatos, seleccionar top 3-5.
Inversión Munger sobre los hilos elegidos:
- ¿Qué hilo importante estoy ignorando?
- ¿Qué perspectiva ausente haría que mi investigación sea parcial?
- ¿Qué escuela / voz disidente no aparece?
Si la inversión revela un hilo crítico faltante, agregarlo y re-ejecutar WDM.
Ejemplos por dominio (NO solo código):
| Dominio | Semilla | Hilos típicos |
|---|---|---|
| Ciencia | Inmunoterapia contra cáncer | Mecanismos moleculares / Ensayos clínicos / Historia y evolución / Controversias y limitaciones / Estado comercial |
| Arte | Minimalismo en música del siglo XX | Compositores clave / Técnicas / Contexto histórico-cultural / Crítica y recepción / Obras emblemáticas |
| Negocio | Modelos de monetización SaaS B2B | Pricing strategies / Métricas financieras / Casos documentados / Marco legal / Psicología de compra B2B |
| Humanidades | Filosofía estoica aplicada moderna | Fuentes primarias (Epicteto, Séneca, Aurelio) / Interpretaciones contemporáneas / Aplicaciones prácticas / Críticas filosóficas / Evidencia empírica psicológica |
| Tecnología | Arquitectura hexagonal en microservicios | Fundamentos teóricos / Implementaciones por lenguaje / Casos reales / Trade-offs y críticas / Herramientas |
Fase 3 — Detectar herramientas disponibles
Antes del primer ciclo, detectar MCPs disponibles y ordenar por preferencia:
Preferencia (mayor a menor velocidad/efectividad):
- MCPs de scraping optimizados para IA: Firecrawl (
firecrawl_scrape,firecrawl_crawl,firecrawl_search,firecrawl_extract) — texto estructurado, rápido - MCPs de documentación oficial: Context7 (
query-docs) — cuando la fuente es una librería/framework - Herramientas nativas:
WebSearch,WebFetch— fallback universal - MCPs de navegación real (Chrome DevTools): DESPRIORIZADOS — solo si el contenido requiere ejecución JS explícita (SPAs sin SSR, contenido tras auth)
Razón: scrapers de IA son 10-50× más rápidos que navegadores reales y dan texto ya estructurado.
Fase 4 — Fuentes semilla sugeridas
La skill presenta al usuario una lista de fuentes semilla pre-cargadas por dominio para que confirme, añada o rechace:
Ciencia general / papers:
- arXiv (https://arxiv.org) — preprints en física, matemáticas, CS, biología, economía
- Semantic Scholar (https://www.semanticscholar.org) — red de citaciones
- Google Scholar (https://scholar.google.com)
- Connected Papers (https://www.connectedpapers.com) — mapas visuales de citaciones
- OpenReview (https://openreview.net) — revisiones abiertas en ML
Medicina / biología:
- PubMed (https://pubmed.ncbi.nlm.nih.gov)
- Cochrane Library (https://www.cochranelibrary.com) — meta-análisis
- WHO (https://www.who.int)
- ClinicalTrials.gov
Humanidades / ciencias sociales:
- JSTOR (https://www.jstor.org)
- SSRN (https://www.ssrn.com)
- Project MUSE (https://muse.jhu.edu)
Código / tecnología:
- GitHub (búsqueda, topics, starred lists de expertos)
- Context7 para docs oficiales (si MCP disponible)
- RFCs (https://www.rfc-editor.org)
- W3C specs (https://www.w3.org/TR/)
Datos / estadística:
- Banco Mundial (https://data.worldbank.org)
- OECD Data (https://data.oecd.org)
- Our World in Data (https://ourworldindata.org)
- Pew Research (https://www.pewresearch.org)
- Eurostat, INE, y equivalentes nacionales
Arte / cultura / humanidades:
- Europeana (https://www.europeana.eu)
- Google Arts & Culture (https://artsandculture.google.com)
- Internet Archive (https://archive.org)
- Project Gutenberg (https://www.gutenberg.org)
Generales:
- Wikipedia — como PUNTO DE PARTIDA. Saltar siempre a la sección de referencias para llegar a Tier 1/2
- Wikidata — datos estructurados
Fuentes locales (si el usuario proporcionó rutas):
- Listar estructura de carpeta
- Priorizar
.md,.pdf,.txt,.doc/.docx,.html,.epub - Usar herramientas de lectura del agente (Read, Grep, Glob)
Fase 5 — Ciclo de investigación (LOOP auto-regulado)
Cada ciclo ejecuta los siguientes sub-pasos.
5.1. Elegir el hilo con menor cobertura
Calcular cobertura actual de cada hilo (hallazgos_registrados / hallazgos_esperados_proxy). Elegir el de menor %.
5.2. WDM + Munger sobre fuentes a usar en ESTE ciclo
WDM por fuente candidata:
| Criterio | Peso | Escala |
|---|---|---|
| Autoridad (Tier) | 5 | Tier 1 = 5 · Tier 2 = 3 · Tier 3 = 2 · Rechazo = 0 |
| Relevancia al hilo actual | 5 | 1-5 por match semántico |
| Accesibilidad | 3 | 5 = full text abierto · 3 = abstract + paywall · 1 = bloqueado |
| Recencia apropiada al campo | 2 | Código: reciente > viejo · Filosofía clásica: viejo = relevante |
| Ausencia de conflicto de interés | 3 | 5 = independiente · 1 = financiada por parte interesada |
Seleccionar top 3-5.
Inversión Munger sobre las fuentes seleccionadas:
- ¿Qué fuente NO estoy usando que debería? (disidentes, escuelas críticas, voces silencia