Cómo se arma una base de conocimiento de IA, paso a paso

No es comprar un software ni volcar todo de una. Se arma en dos capas: primero el core de documentos, después lo transaccional. El proceso real, sin humo.

"¿Y esto cómo se arma?" Es la primera pregunta de todo CEO después de entender qué es una base de conocimiento. La mala noticia: no es comprar un software y prenderlo. La buena: tampoco es un proyecto de dos años con una consultora. Se arma por capas, y se puede tener la primera versión corriendo sobre un área en semanas. Acá está el proceso, sin humo.

PROCESO DE CONSTRUCCIÓN 6 pasos para armar una base de conocimiento 01El core de documentos60% del conocimiento: documentación, decks, SOPs02Capa transaccional40% restante: mails, llamadas, Slack, CRM03Estructura consultableIndexar, vectorizar y etiquetar para máquinas04Conexión con sistemasAPIs y MCP para orquestar servicios05Permisos y governanceControl de acceso, audit trail y quality gates06Mantenimiento continuoAsignar dueño y alimentar la base regularmente

El orden importa: primero el core, después lo transaccional

El error más caro es abrir el firehose de toda la empresa el día uno: cada mail, cada llamada, cada Slack, todo junto. Te ahogás en ruido. El orden correcto es al revés, y se arma en dos capas.

Primero, el core: todos tus documentos y presentaciones, el material que define la dirección de la empresa. Eso cubre cerca del 60% del conocimiento que importa, y es curado y de alta señal. Después, encima de ese core, sumás la capa transaccional: mails y conversaciones, el conocimiento vivo que cambia todos los días. El core te da el esqueleto. Lo transaccional, el músculo.

CAPAS DE LA BASE Core + Transaccional = Base completa 60%El core (documentos curados)Estrategia, dirección, políticas, playbooks ySOPs. Alta señal, finito, es el esqueleto de laempresa.40%Transaccional (flujo vivo)Mails, llamadas, Slack, CRM. El conocimiento real:edge cases, objeciones y patrones de clientes.

Paso 1: El core de documentos (el 60%)

Tomá todo lo que ya describe a tu empresa y cargalo: documentación de producto, decks de estrategia, propuestas, contratos modelo, playbooks, SOPs y políticas. Es el material que forma la dirección de la compañía, qué hace, qué vende, cómo decide.

Con solo eso, la IA arma un entendimiento sorprendentemente bueno de tu empresa:

  • La estrategia y la dirección: hacia dónde va, qué prioriza, cómo piensa el negocio.
  • Cómo habla la empresa: el tono y el lenguaje, cómo le escribe a un cliente.
  • Qué tipos de cliente tiene y cómo se le habla a cada uno.

De ese core sale un documento consultable de alta calidad. Y, clave, es la base sobre la que después se conectan los otros servicios: le da contexto a todo lo que viene encima.

Es curado, finito y de alta señal, lo opuesto al ruido. Por eso es el cimiento: con solo el core indexado, la IA ya puede responder con criterio sobre tu empresa. Y se arma rápido, porque ese material ya existe, solo está disperso. Una primera versión del core puede estar en semanas.

Paso 2: La capa transaccional (el 40% restante)

Sobre el core, ahora sumás el flujo que pasa todos los días: los mails que entran y salen del dominio, las llamadas grabadas y transcriptas, las conversaciones de Slack o WhatsApp Business, los eventos del CRM y los tickets. Las llamadas y las conversaciones son, de lejos, lo más valioso de esta capa.

Es donde aparece lo que ningún documento tiene:

  1. Visión 360 del cliente: todo lo que se dijo e hizo con cada cuenta, junto y consultable, no repartido en la cabeza de tres personas.
  2. Los edge cases y los detalles finos que nunca llegan a una presentación: la objeción rara, el pedido puntual, el "esto el cliente lo odia". El conocimiento real vive en las conversaciones, no en los decks.
  3. El seguimiento vivo: cómo va cambiando cada cliente, qué dice esta semana, qué patrones se repiten. Te deja armar lecturas semanales en vez de fotos viejas.

Acá vive la regla cultural más dura: si quedó registrado, la IA lo usa; si no, no existe. Vas a chocar con los seniors que "se saben todo de memoria". Esa memoria, hoy, es un activo personal; la base la vuelve un activo de la empresa. Y acá sí importa el foco: no metas el transaccional de toda la empresa de una, empezá por el área de más dolor (comercial suele ganar, el ROI es medible y rápido) y andá sumando. Si todavía no sabés por cuál, leé cómo elegir el primer proyecto de IA.

Paso 3: Estructura (que sea consultable por una máquina)

Juntar data no alcanza. Hay que estructurarla para que un agente la consulte, no solo un humano. Esto incluye:

  • Indexar y vectorizar los documentos para que la IA busque por significado, no solo por palabra exacta.
  • Etiquetar la información por área, tipo y fecha.
  • Definir qué es la "fuente de verdad" cuando dos sistemas se contradicen.

Es la diferencia entre un buscador interno y una base sobre la que la IA puede razonar.

Paso 4: Conexión (APIs y MCP)

La base no reemplaza tus sistemas, los orquesta. Acá se conectan tus servicios y apps vía API o vía un MCP server, el estándar que dejó la IA hablar con tus herramientas. El CRM, el note-taker, el billing y las apps internas quedan conectados, y la base pasa a ser el intermediario que tiene contexto de todo.

Toda solución nueva que sumás después nace ya conectada a esta capa. Las rutas existen por default y el usuario no las arma a mano. Esto es lo que separa la etapa 3 de la etapa 4 de madurez: el momento en que la base se vuelve el centro que orquesta.

Paso 5: Permisos y governance

Antes de soltar esto, definí quién ve qué y qué decide la IA sola. No todo el mundo tiene que acceder a todo, y no todo proceso se automatiza sin revisión humana. Esta capa incluye:

  • Permisos por rol: el agente comercial no ve datos de RRHH.
  • Audit trail: cada respuesta y cada acción queda registrada y es trazable.
  • Quality gates: lo de alto riesgo (un mail a un cliente enterprise, una propuesta grande) pasa por aprobación humana; lo de bajo riesgo corre solo.

Saltarse esta capa es lo que convierte un piloto prometedor en un incidente el día 30. No es un nice-to-have.

Paso 6: Mantenimiento y aprendizaje

Una base de conocimiento no es un proyecto que termina, es un activo que se mantiene. Cada deal cerrado o perdido, cada ticket, cada decisión nueva vuelve adentro y la mejora. Esto requiere un dueño claro (un rol nuevo, tipo AI Operations Lead) y disciplina para que la base no se desactualice.

Si la base deja de alimentarse, vuelve a ser un Drive muerto en seis meses.

¿Quién hace esto? El perfil bisagra

No lo hace IT solo ni un consultor que viene y se va. Lo hace un perfil nuevo: alguien que entiende el negocio y sabe implementar IA, el forward-deployed engineer aplicado a la empresa. Y, clave: hoy esto lo pueden empujar personas no técnicas con el know-how del proceso, vía prompt-to-code, sin esperar seis meses al backlog de IT.

IMPLEMENTACIÓN Timing y alcance SemanasPrimera versión por áreasobre un área de dolor puntual6 mesesVida útil sin mantenimientola base vuelve un Drive muerto si no se alimenta

Cuánto tarda y errores comunes

Una primera versión sobre un área puntual: semanas, no meses. La base completa crece con el tiempo. Los errores que más se repiten:

  1. Querer abarcar toda la empresa de una.
  2. Saltarse el governance "para ir más rápido".
  3. Armarla y no asignarle un dueño que la mantenga.
  4. Medir "horas ahorradas" en vez de cycle time del proceso de punta a punta.

¿Querés armar la primera capa sobre tu área de más dolor? Eso hacemos en Magnesium. Agendá 30 minutos: cal.com/rodrigo-varela-qgukqn/30min.

Fuentes

  1. Model Context Protocol — Anthropic
  2. Claude para empresas — Anthropic
  3. How to Build a Self-Improving Company with AI — Y Combinator (Tom Blomfield)
  4. n8n, automatización de workflows con IA — n8n