Búsqueda vectorial
La búsqueda vectorial es un método para encontrar información según el significado semántico en lugar de coincidencias exactas de palabras clave. Funciona convirtiendo texto en representaciones numéricas (vectores/embeddings) y encontrando los vectores más similares en una base de datos. También se llama búsqueda semántica o búsqueda por similitud.
Cómo funciona
La búsqueda tradicional por palabras clave requiere coincidencias exactas: buscar "pricing" no encontrará un documento sobre "cost" o "fees". La búsqueda vectorial entiende que esas palabras están relacionadas semánticamente. Convierte tanto la consulta como todos los documentos en vectores de alta dimensión usando modelos de embeddings y luego encuentra los documentos cuyos vectores están más cerca del vector de la consulta.
Bases de datos vectoriales como pgvector, Pinecone y Weaviate almacenan estos embeddings y realizan búsquedas rápidas por similitud. La calidad de la búsqueda vectorial depende del modelo de embeddings utilizado; mejores modelos crean representaciones semánticas más precisas.
Revisión operativa
En la práctica, vector search debe evaluarse por lo que cambia en el flujo de soporte. Pregunta si mejora la precisión de las respuestas, reduce el trabajo repetido de los agentes, aclara las decisiones de transferencia o facilita los informes. Si la respuesta es solo "suena moderno", el concepto aún no es operativo.
Un ejemplo concreto es coincidencia de sinónimos en consultas de soporte: Un cliente busca "política de reembolso", pero el artículo de ayuda se titula "Devoluciones y garantía de devolución". La búsqueda vectorial encuentra el artículo porque ambas frases comparten significado semántico, mientras que la búsqueda por palabras clave devolvería cero resultados.
La conclusión más sencilla es: La búsqueda vectorial coincide por significado en lugar de palabras clave exactas, cerrando la brecha de vocabulario entre clientes y documentación
Por qué importa
Cómo usa Chatsy búsqueda vectorial
Ejemplos reales
Puntos clave
Cuándo búsqueda vectorial no aplica
- Tienes menos de 1,000 documentos. La búsqueda por palabras clave está bien.
- Tus consultas son de coincidencia exacta (SKU de producto, IDs). Usa indexación tradicional.
- Tu contenido se actualiza varias veces al día y el coste de regenerar embeddings supera la mejora de recuperación.
Preguntas frecuentes
¿En qué se diferencia la búsqueda vectorial de la búsqueda por palabras clave?
La búsqueda por palabras clave coincide con palabras exactas. La búsqueda vectorial coincide con significado. Buscar "cancelar mi cuenta" con búsqueda por palabras clave solo encuentra documentos que contienen esas palabras exactas. La búsqueda vectorial también encuentra documentos sobre "cerrar cuenta", "eliminar perfil" o "terminar suscripción" porque tienen significado similar.
¿Qué es una base de datos vectorial?
Una base de datos vectorial es almacenamiento especializado para vectores de embeddings que admite búsquedas rápidas por similitud. Entre los ejemplos están pgvector (extensión de PostgreSQL), Pinecone, Weaviate y Qdrant. Chatsy usa pgvector para mantener todo en PostgreSQL.
¿Qué tan rápida es la búsqueda vectorial frente a la búsqueda por palabras clave?
La búsqueda vectorial con índices optimizados (HNSW o IVFFlat) devuelve resultados en 5-50 milisegundos para bases de datos con millones de vectores. Es comparable a la búsqueda por palabras clave y suficientemente rápida para respuestas de chatbot en tiempo real.
¿La búsqueda vectorial funciona con consultas cortas de una o dos palabras?
Las consultas cortas producen vectores menos precisos porque hay menos contexto semántico que codificar. Para consultas de una sola palabra como "pricing", la búsqueda por palabras clave suele superar a la búsqueda vectorial, por eso se recomienda la búsqueda híbrida que combina ambos métodos.
¿Qué es la búsqueda vectorial en términos simples?
La búsqueda vectorial es una forma de encontrar "cosas que significan más o menos lo mismo" en lugar de "cosas que contienen exactamente las mismas palabras". Convierte cada pieza de texto en una lista de números (un vector) para que el computador pueda medir matemáticamente qué tan cerca están dos ideas, incluso cuando las palabras son diferentes.
¿Cuál es la diferencia entre Elasticsearch y la búsqueda vectorial?
Elasticsearch es un motor de búsqueda construido tradicionalmente alrededor de búsqueda por palabras clave con índice invertido (BM25). La búsqueda vectorial usa embeddings y puntuación de similitud en su lugar. Elasticsearch y OpenSearch modernos ya admiten búsqueda vectorial de forma nativa, así que la pregunta práctica suele ser palabras clave vs híbrida vs vectorial pura, no Elasticsearch vs vectorial.
¿Qué es una consulta vectorial?
Una consulta vectorial es una sola consulta de similitud contra una base de datos vectorial: le das un embedding de consulta y devuelve los top-K embeddings almacenados más similares. En un pipeline de chatbot, cada mensaje de cliente activa una o más consultas vectoriales para encontrar los pasajes más relevantes de la base de conocimiento antes de que el LLM genere una respuesta.