IA y soporte al cliente Glosario
Definiciones claras de términos clave en chatbots con IA, automatización de soporte al cliente e IA conversacional.
IA agéntica
La IA agéntica se refiere a sistemas de inteligencia artificial que pueden planificar, razonar y ejecutar acciones de varios pasos de forma autónoma para lograr un objetivo específico. A diferencia de la IA tradicional que responde a prompts individuales, la IA agéntica descompone tareas complejas, usa herramientas, toma decisiones y adapta su enfoque según resultados intermedios.
Agente de IA
Un agente de IA es un sistema de software que percibe su entorno mediante entradas (mensajes, datos, eventos), razona sobre objetivos y acciones disponibles, y actúa de forma autónoma para alcanzarlos. Los agentes de IA combinan comprensión del lenguaje con uso de herramientas, memoria y toma de decisiones para operar con mínima supervisión humana.
Alucinación de IA
La alucinación de IA es un fenómeno en el que un modelo de lenguaje grande genera texto fluido, seguro y plausible, pero factualmente incorrecto, fabricado o no respaldado por ningún dato fuente. El modelo "alucina" información que no existe en sus datos de entrenamiento ni en el contexto proporcionado.
Tiempo medio de gestión (AHT)
El tiempo medio de gestión (AHT) es una métrica de soporte al cliente que mide la duración total promedio de una interacción con cliente desde el inicio hasta la resolución. Incluye tiempo activo de conversación, tiempo de espera y cualquier trabajo de cierre posterior a la interacción (notas, actualizaciones de tickets, acciones de seguimiento).
Chatbot
Un chatbot es una aplicación de software diseñada para simular conversación humana mediante texto o voz. Los chatbots van desde programas simples basados en reglas que siguen guiones predefinidos hasta sistemas sofisticados con IA que entienden lenguaje natural y generan respuestas contextuales.
Ventana de contexto
Una ventana de contexto es el número máximo de tokens que un modelo de lenguaje grande puede procesar en una sola solicitud, incluyendo toda la entrada (prompt de sistema, historial de conversación, contexto recuperado) y la salida (la respuesta generada). Representa la memoria de trabajo efectiva del modelo.
IA conversacional
La IA conversacional es una categoría de inteligencia artificial que permite al software entender, procesar y responder al lenguaje humano en un formato natural basado en diálogo. Combina procesamiento de lenguaje natural (NLP), aprendizaje automático y gestión de diálogo para impulsar chatbots, asistentes virtuales e interfaces de voz.
CSAT (puntuación de satisfacción del cliente)
CSAT (puntuación de satisfacción del cliente) es una métrica que mide qué tan satisfechos están los clientes con una interacción, producto o experiencia específica. Normalmente se mide pidiendo a los clientes que califiquen su experiencia en una escala (1-5 o 1-10) justo después de una interacción.
Embedding
Un embedding es un vector numérico denso (arreglo de números) que representa el significado semántico de una pieza de texto. Los modelos de embeddings convierten palabras, oraciones o documentos en vectores de tamaño fijo en un espacio de alta dimensión, donde los textos semánticamente similares quedan cerca unos de otros.
Fine-tuning
El fine-tuning es el proceso de tomar un modelo de lenguaje grande preentrenado y seguir entrenándolo con un dataset más pequeño y específico de un dominio para especializar su comportamiento, conocimiento o estilo de salida. Los pesos del modelo se actualizan para reflejar los nuevos datos de entrenamiento, creando una versión personalizada del modelo base.
Resolución en el primer contacto (FCR)
La resolución en el primer contacto (FCR) es una métrica de soporte al cliente que mide el porcentaje de problemas de clientes resueltos completamente durante la primera interacción, sin requerir contactos de seguimiento, devoluciones de llamada, escalados o tickets adicionales. También se llama resolución en la primera llamada o resolución en un solo toque.
Tiempo de primera respuesta (FRT)
El tiempo de primera respuesta (FRT) es una métrica de soporte al cliente que mide el tiempo transcurrido entre que un cliente envía una solicitud de soporte y recibe la primera respuesta significativa. Es uno de los indicadores más importantes de capacidad de respuesta del soporte.
Transferencia humana
La transferencia humana (también llamada toma de control humana, escalado a agente o transferencia a agente en vivo) es el proceso de pasar una conversación activa de chatbot a un agente humano de soporte. El agente recibe todo el historial de conversación para que el cliente no tenga que repetirse.
Búsqueda híbrida
La búsqueda híbrida es un método de recuperación que combina búsqueda semántica (basada en vectores/embeddings) con búsqueda léxica (basada en palabras clave/BM25) para encontrar información relevante. Al fusionar ambos enfoques, logra mayor precisión que cualquiera de los métodos por separado.
Clasificación de intención
La clasificación de intención es el proceso de analizar un mensaje de usuario y categorizarlo en una intención predefinida: la acción o información que busca el usuario. Por ejemplo, clasificar "I want to cancel my subscription" como intención de "cancelación" y "How much is the Pro plan?" como intención de "consulta de precios".
Base de conocimiento
Una base de conocimiento es una colección organizada de información, normalmente artículos de ayuda, FAQ, guías y documentación, que permite a los clientes encontrar respuestas de forma independiente. En el soporte moderno, las bases de conocimiento también sirven como datos de entrenamiento para chatbots con IA.
Modelo de lenguaje grande (LLM)
Un modelo de lenguaje grande (LLM) es un tipo de modelo de IA entrenado con enormes cantidades de datos de texto para entender y generar lenguaje humano. Entre los ejemplos están OpenAI GPT-5, Anthropic Claude 4.5, Google Gemini 3 y Meta Llama. Los LLM impulsan chatbots modernos, asistentes de escritura e IA conversacional.
Live chat
El live chat es un canal de comunicación que permite conversaciones de texto en tiempo real entre clientes y agentes humanos de soporte mediante un widget en un sitio web o app. A diferencia del correo (asíncrono) o el teléfono (voz), el live chat ofrece soporte inmediato basado en texto.
Procesamiento de lenguaje natural (NLP)
El procesamiento de lenguaje natural (NLP) es una rama de la inteligencia artificial enfocada en permitir que los computadores entiendan, interpreten y generen lenguaje humano. Combina lingüística computacional con aprendizaje automático para procesar texto y voz.
NPS (Net Promoter Score)
Net Promoter Score (NPS) es una métrica de lealtad del cliente que mide qué tan probable es que los clientes recomienden tu producto o servicio a otras personas. Los clientes califican esa probabilidad en una escala de 0 a 10 y se clasifican como promotores (9-10), pasivos (7-8) o detractores (0-6). NPS = % de promotores menos % de detractores.
Soporte omnicanal
El soporte omnicanal es una estrategia de atención al cliente que ofrece una experiencia fluida y unificada en todos los canales de comunicación: live chat, correo, teléfono, redes sociales, SMS, apps de mensajería y portales de autoservicio. El contexto del cliente y el historial de conversación persisten entre canales, por lo que los clientes nunca tienen que repetirse.
Ingeniería de prompts
La ingeniería de prompts es la práctica de diseñar, estructurar y refinar las instrucciones (prompts) dadas a modelos de lenguaje grandes para obtener respuestas precisas, relevantes y bien formateadas. Abarca prompts de sistema, plantillas de prompts de usuario, ejemplos few-shot y restricciones de salida.
Generación aumentada por recuperación (RAG)
La generación aumentada por recuperación (RAG) es una arquitectura de IA que mejora las respuestas de los modelos de lenguaje grandes al recuperar primero información relevante de una fuente de conocimiento y luego usarla para generar respuestas precisas y fundamentadas. En lugar de depender solo del conocimiento entrenado, los sistemas RAG buscan en tu documentación en tiempo real.
Búsqueda semántica
La búsqueda semántica es una técnica de búsqueda que encuentra información según el significado y la intención detrás de una consulta, en lugar de coincidir palabras clave exactas. Usa comprensión de lenguaje natural y embeddings vectoriales para identificar contenido conceptualmente relevante, incluso cuando la consulta y el contenido no comparten palabras.
Análisis de sentimiento
El análisis de sentimiento es una técnica de NLP que identifica el tono emocional (positivo, negativo, neutral o emociones específicas como frustración o urgencia) en el texto. En soporte al cliente, ayuda a los equipos a priorizar y responder de forma adecuada a los mensajes de clientes.
SLA (acuerdo de nivel de servicio)
Un acuerdo de nivel de servicio (SLA) es un compromiso formal entre un proveedor de servicios y un cliente que define estándares de servicio medibles, incluidos tiempos de respuesta, tiempos de resolución, garantías de disponibilidad y procedimientos de escalado. En soporte al cliente, los SLA establecen expectativas sobre qué tan rápido y eficazmente se gestionarán los problemas.
Desvío de tickets
El desvío de tickets ocurre cuando un cliente resuelve su pregunta o problema sin crear un ticket de soporte ni contactar a un agente humano. Normalmente sucede mediante autoservicio (base de conocimiento, FAQ) o resolución con chatbot de IA.
Token
Un token es la unidad fundamental de texto que procesan los modelos de lenguaje grandes. Los tokens son fragmentos de palabras, palabras completas o signos de puntuación que el modelo lee y genera. En inglés, un token equivale aproximadamente a 3/4 de una palabra, por lo que 100 palabras son aproximadamente 130-140 tokens.
Búsqueda vectorial
La búsqueda vectorial es un método para encontrar información según el significado semántico en lugar de coincidencias exactas de palabras clave. Funciona convirtiendo texto en representaciones numéricas (vectores/embeddings) y encontrando los vectores más similares en una base de datos. También se llama búsqueda semántica o búsqueda por similitud.
Webhook
Un webhook es un mecanismo de callback HTTP que envía datos automáticamente de un sistema a otro cuando ocurre un evento específico. En lugar de consultar continuamente una API en busca de actualizaciones, el sistema de origen envía datos a una URL configurada en tiempo real. Los webhooks son la columna vertebral de las integraciones en tiempo real entre aplicaciones SaaS.
Mira estos conceptos en acción
Prueba Chatsy gratis y experimenta RAG, búsqueda híbrida y transferencia humana en una plataforma real de soporte con IA.
Empezar gratis