La búsqueda vectorial es un método para encontrar información según el significado semántico en lugar de coincidencias exactas de palabras clave. Funciona convirtiendo texto en representaciones numéricas (vectores/embeddings) y encontrando los vectores más similares en una base de datos. También se llama búsqueda semántica o búsqueda por similitud.
La búsqueda tradicional por palabras clave requiere coincidencias exactas: buscar "pricing" no encontrará un documento sobre "cost" o "fees". La búsqueda vectorial entiende que esas palabras están relacionadas semánticamente. Convierte tanto la consulta como todos los documentos en vectores de alta dimensión usando modelos de embeddings y luego encuentra los documentos cuyos vectores están más cerca del vector de la consulta.
Bases de datos vectoriales como pgvector, Pinecone y Weaviate almacenan estos embeddings y realizan búsquedas rápidas por similitud. La calidad de la búsqueda vectorial depende del modelo de embeddings utilizado; mejores modelos crean representaciones semánticas más precisas.
En la práctica, vector search debe evaluarse por lo que cambia en el flujo de soporte. Pregunta si mejora la precisión de las respuestas, reduce el trabajo repetido de los agentes, aclara las decisiones de transferencia o facilita los informes. Si la respuesta es solo "suena moderno", el concepto aún no es operativo.
Un ejemplo concreto es coincidencia de sinónimos en consultas de soporte: Un cliente busca "política de reembolso", pero el artículo de ayuda se titula "Devoluciones y garantía de devolución". La búsqueda vectorial encuentra el artículo porque ambas frases comparten significado semántico, mientras que la búsqueda por palabras clave devolvería cero resultados.
La conclusión más sencilla es: La búsqueda vectorial coincide por significado en lugar de palabras clave exactas, cerrando la brecha de vocabulario entre clientes y documentación
La búsqueda por palabras clave coincide con palabras exactas. La búsqueda vectorial coincide con significado. Buscar "cancelar mi cuenta" con búsqueda por palabras clave solo encuentra documentos que contienen esas palabras exactas. La búsqueda vectorial también encuentra documentos sobre "cerrar cuenta", "eliminar perfil" o "terminar suscripción" porque tienen significado similar.
Una base de datos vectorial es almacenamiento especializado para vectores de embeddings que admite búsquedas rápidas por similitud. Entre los ejemplos están pgvector (extensión de PostgreSQL), Pinecone, Weaviate y Qdrant. Chatsy usa pgvector para mantener todo en PostgreSQL.
Un cliente escribe "cant login 2fa broken", texto informal y abreviado. La búsqueda vectorial aun así lo empareja con un artículo bien escrito titulado "Solucionar problemas de autenticación de dos factores" porque la intención semántica es la misma.
La búsqueda vectorial con índices optimizados (HNSW o IVFFlat) devuelve resultados en 5-50 milisegundos para bases de datos con millones de vectores. Es comparable a la búsqueda por palabras clave y suficientemente rápida para respuestas de chatbot en tiempo real.
Las consultas cortas producen vectores menos precisos porque hay menos contexto semántico que codificar. Para consultas de una sola palabra como "pricing", la búsqueda por palabras clave suele superar a la búsqueda vectorial, por eso se recomienda la búsqueda híbrida que combina ambos métodos.
La búsqueda vectorial es una forma de encontrar "cosas que significan más o menos lo mismo" en lugar de "cosas que contienen exactamente las mismas palabras". Convierte cada pieza de texto en una lista de números (un vector) para que el computador pueda medir matemáticamente qué tan cerca están dos ideas, incluso cuando las palabras son diferentes.
Elasticsearch es un motor de búsqueda construido tradicionalmente alrededor de búsqueda por palabras clave con índice invertido (BM25). La búsqueda vectorial usa embeddings y puntuación de similitud en su lugar. Elasticsearch y OpenSearch modernos ya admiten búsqueda vectorial de forma nativa, así que la pregunta práctica suele ser palabras clave vs híbrida vs vectorial pura, no Elasticsearch vs vectorial.
Una consulta vectorial es una sola consulta de similitud contra una base de datos vectorial: le das un embedding de consulta y devuelve los top-K embeddings almacenados más similares. En un pipeline de chatbot, cada mensaje de cliente activa una o más consultas vectoriales para encontrar los pasajes más relevantes de la base de conocimiento antes de que el LLM genere una respuesta.