Transcripciones de llamadas: tu mayor base de conocimiento
Todas tus llamadas se graban y se transcriben, pero ese conocimiento no queda en ningún lado. Cómo convertirlas en la mayor base de conocimiento de tu empresa.
Todas las reuniones de tu empresa se graban y se transcriben. Pero ese conocimiento no va a ningún lado. Ni la mejor reunión del trimestre con un cliente, ni la semanal de todo el equipo, ni el proceso de ventas que nunca cerró y nadie sabe bien por qué. Los equipos usan las transcripciones para lo inmediato, pero el conocimiento no queda guardado en la compañía. Las decisiones, el contexto, lo que dijo el cliente, el "ah, eso lo hacemos así por tal motivo": casi todo eso nace hablando, en reunión. Tenés un problema de información que se evapora.
Tu fuente de conocimiento más valiosa no se está usando: las llamadas
Si estás pensando en procesar todas tus llamadas para generar una mega minuta, estás en el camino correcto: es el primer paso hacia una base de conocimiento de tu empresa. Las llamadas son una fuente clave de información en la época de la inteligencia artificial por tres motivos:
- Son riquísimas en contexto. Exactamente qué dijo un cliente, cómo se expresa y qué opina es información que no queda guardada en ningún lado. Más todavía: las llamadas internas tienen estrategia, decisiones, definiciones y formas de trabajar que no viven en ningún documento.
- Transcribir ya no es el problema. Hace dos años transcribir una reunión era un lío. Hoy Otter, Fireflies, Granola o el propio asistente de Zoom, Meet y Teams te dejan la transcripción completa sin que muevas un dedo. El texto es barato y abundante.
- Procesar texto es la especialidad de la IA. Antes de GPT y Claude era inviable. Hoy hay modelos que procesan millones de palabras por centavos.
Cómo procesar millones de palabras sin perder contexto
Aunque suena atractivo juntar todas las llamadas y dárselas a la IA, no es tan fácil. Si lo hiciéramos así, aparecen tres problemas:
- Pérdida extrema de contexto y, en consecuencia, alucinaciones. La IA estaría nadando en millones de palabras. Para contestar una pregunta concreta tendría que leer demasiada información, con pocas chances de encontrar la correcta.
- Falta de contextualización de la transcripción. ¿Es un cliente? ¿Es interna? La IA no tiene forma de saberlo si no se lo decimos, y sin preprocesamiento eso es imposible. Si le pregunto por la conversación con Nestlé, no la va a poder encontrar.
- Falta de sinónimos. Entre cientos o miles de llamadas decimos lo mismo de maneras distintas. "El cliente se dio de baja" es lo mismo que "churneó", pero la IA tiene que poder reconocerlo entre toda la data.
La solución: vectorizar las llamadas
Vectorizar es convertir el texto en números que capturan el significado, no las palabras exactas. Suena abstracto, pero el efecto es muy concreto: en vez de buscar con Ctrl+F la palabra justa, podés preguntar "qué dijo el cliente sobre el precio" y el sistema encuentra el momento aunque en la reunión nadie haya usado la palabra "precio" (dijeron "presupuesto", "está caro", "no nos cierra el número"). Esos números se llaman embeddings, y son lo que permite que una IA busque por significado y después responda con tu propia data. Esa técnica, IA que responde consultando tus documentos, es lo que se conoce como RAG. Es exactamente el motor de una base de conocimiento.
El flujo, de la reunión a la respuesta
No es magia, son seis pasos:
- Capturar. La transcripción automática de la herramienta que ya uses.
- Categorizar. Clasificar cada llamada: interna o con cliente, cuál, quién participó. Esta es la metadata que después te deja filtrar.
- Limpiar y trocear. Se parte la transcripción en pedazos manejables (chunks) y se saca el ruido ("se cae el audio", "esperemos a Juan").
- Vectorizar. Cada pedazo se convierte en embeddings.
- Guardar. Todo va a la base de conocimiento, junto con el resto de tu información.
- Preguntar. La IA recupera los pedazos relevantes y te responde con la fuente, sin inventar.
El paso que casi todos saltan es la metadata. Sin ella tenés un montón de texto suelto. Con ella podés pedir "todo lo que hablamos con este cliente en los últimos tres meses" y que tenga sentido.
Lo que NO tenés que subir
Una base de conocimiento no es un volcadero. Subir todo es la forma más rápida de arruinarla. Quedan afuera:
- Lo sensible: temas legales, de RRHH, sueldos, una posible compra o venta.
- Datos personales de la gente en la llamada (y ojo con avisar que se está grabando y para qué).
- El ruido puro: charla de pasillo, chistes, "probando el micrófono".
Garbage in, garbage out. Una base curada con 50 reuniones que importan vale mil veces más que una con 500 sin filtrar.
Cómo se ve cuando funciona
De golpe podés responder, en segundos, cosas que antes dependían de que la persona correcta estuviera disponible y se acordara:
- ¿Qué le prometimos a este cliente en la última call?
- ¿Por qué descartamos a ese proveedor el año pasado?
- ¿Qué objeción aparece siempre en las demos y cómo la respondimos las veces que cerramos?
- ¿Qué quedó decidido sobre el roadmap y quién era el responsable?
Tus reuniones dejan de ser un evento que pasa y se olvida, y pasan a ser un activo que se puede consultar. Onboarding más rápido, equipo comercial con memoria, decisiones que no se repiten desde cero.
Empezá por un solo flujo (las llamadas con clientes, por ejemplo), cargá diez y probá cinco preguntas reales. Eso es, en chiquito, el cerebro de IA de tu empresa: tu propia data, consultable, respondida con fuente. Si querés que te ayudemos a montarlo sobre tu base de conocimiento, agendá una llamada de 30 minutos y lo vemos sobre tu caso.
Fuentes
- Introducing Contextual Retrieval — Anthropic
- Embeddings guide — OpenAI
- Stop the Meeting Madness — Harvard Business Review
- Otter.ai, transcripción automática de reuniones — Otter.ai