Skip to main content
El sistema RAG (Retrieval-Augmented Generation) permite que tu agente responda preguntas basandose en tus propios documentos.
Disponible en planes Growth y Enterprise.

Como funciona

  1. Subes un documento (PDF, DOCX, TXT, Markdown)
  2. Thaliq lo divide en chunks (fragmentos)
  3. Genera embeddings (representaciones numericas) con Voyage AI
  4. Cuando un usuario hace una pregunta, el agente busca los chunks mas relevantes
  5. Usa esa informacion como contexto para generar una respuesta precisa
Pregunta del usuario


Busqueda semantica (embeddings)


Chunks mas relevantes (top-k)


Claude + contexto → Respuesta basada en tus documentos

Subir documentos

  1. Ve a Documents en el menu lateral
  2. Click en Subir documento
  3. Selecciona el archivo

Formatos soportados

FormatoExtension
PDF.pdf
Word.docx
Texto plano.txt
Markdown.md

Procesamiento

Al subir un documento:
  • Se extrae el texto
  • Se divide en chunks (fragmentos de ~500 tokens)
  • Se generan embeddings para cada chunk
  • El documento queda listo para busquedas
El procesamiento toma unos segundos dependiendo del tamaño del documento.

Ver chunks

Puedes ver como se dividio tu documento:
  1. Click en un documento de la lista
  2. Selecciona la pestaña Chunks
  3. Veras cada fragmento con su contenido

Probar busquedas

Usa el RAG Tester para verificar que las busquedas retornen los resultados esperados:
  1. En la seccion de documentos, usa el buscador
  2. Escribe una pregunta natural (ej: “¿Cuales son los horarios?”)
  3. Veras los chunks mas relevantes con su score de similitud
Si los resultados no son los esperados, intenta reformular la pregunta o revisa que el documento contenga la informacion relevante.

Reprocesar documentos

Si actualizas un documento, puedes reprocesarlo:
  1. Click en el documento
  2. Click en Reprocesar
  3. Se regeneran los chunks y embeddings

Buenas practicas

  • Documentos claros: Textos bien estructurados generan mejores chunks
  • Titulos y secciones: Ayudan al sistema a dividir el contenido de forma logica
  • Evita imagenes: El RAG procesa texto, no imagenes dentro de PDFs
  • Actualiza regularmente: Sube versiones actualizadas de tus documentos