Si llevas un negocio español en 2026 y tus clientes todavía tienen que escribirte un email y esperar, los estás perdiendo a manos de empresas que ya respondieron al WhatsApp de ese mismo cliente hace 42 segundos.
Acabamos de terminar un despliegue de 5 meses para una aseguradora regional en Valencia: 240 empleados, 4 oficinas, ~38.000 pólizas activas. Su equipo de atención al cliente de 9 personas se ahogaba. Sustituimos la parte baja del embudo con un agente de IA en WhatsApp Business — no como experimento, en producción. Los números son incómodos para cualquiera que siga haciendo las cosas a la vieja usanza.
Este artículo recorre qué construimos, qué costó, qué falló y qué le recomendaríamos hacer hoy a cualquier PYME española aunque no nos contrate.
Por qué WhatsApp específicamente (los datos que nadie discute)
Hicimos un sondeo de 30 días con los clientes del cliente antes del proyecto. 1.184 respuestas.
- 84% dijo que WhatsApp es su canal preferido para contactar con una empresa de servicios
- 58% dijo que abandonaría una reclamación si tuviera que llamar por teléfono con música de espera
- 71% esperaba respuesta en menos de 10 minutos, fuera o no horario comercial
- ¿La marca mejor valorada de su ecosistema de clientes? Un banco con un 9,1/10, que responde por WhatsApp en menos de 90 segundos — incluso a las 23:00.
El email fue el tercer canal preferido. Por detrás de los DMs de Instagram. El email se está muriendo para B2C en España.
Qué construimos exactamente
El sistema completo son grosso modo cinco capas apiladas:
1. WhatsApp Business Cloud API (la oficial)
No usamos Twilio ni 360dialog como intermediarios. Conectamos directo con la Cloud API oficial de Meta. Razones:
- Sin recargo por conversación (0,025–0,040€ ahorrados por conversación; multiplicado por 18.000 conversaciones/mes, es dinero serio)
- Acceso directo al portal de plantillas
- Funciones nativas de handover al humano
El setup nos llevó 3 días con su Business Manager y el departamento legal. Burocracia, no ingeniería.
2. Una capa de retrieval (RAG) sobre su conocimiento existente
No hicimos fine-tuning de un modelo. Nunca lo hacemos para este tipo de proyecto. En su lugar montamos un pipeline de RAG limpio que tira de:
- Sus PDFs de pólizas (1.400, mayoría Word/PDF — los escaneados los pasamos por OCR)
- Su Notion interna ("cómo cancelo una póliza", "qué dice el art. 4 del seguro de hogar")
- Sus FAQs (200 entradas)
- Su CRM (historial de pólizas + siniestros por cliente, scoped por sesión)
Embeddings con text-embedding-3-large de OpenAI, almacenados en Postgres + pgvector. Reranker encima. Coste total de infra: unos 380€/mes. Hemos visto a vendors cobrar por "RAG enterprise" lo que nosotros hosteamos por el precio de una cena en Madrid.
3. El agente (donde la mayoría de proyectos fallan)
El modelo es GPT-4o (mediados de 2025) pero la magia está en tres límites:
- Tools, no respuesta libre: el agente solo puede hacer cinco cosas — responder preguntas informativas, generar un presupuesto, crear un parte de siniestro, agendar una llamada con un humano, escalar. Sin acciones misteriosas.
- Confirmación de acción: antes de cualquier llamada que cambie estado (crear siniestro, agendar callback, mandar PDF de presupuesto), el agente resume al cliente en español y pregunta "¿confirmas?".
- Reglas duras de handoff: si el usuario dice cualquiera de ~30 frases trigger ("queja", "denuncia", "abogado", "consumo", "indemnización"), el agente escala inmediatamente y deja de hablar. Sin excepciones.
La tercera regla es la que se saltan la mayoría de las startups de "atención con IA". Un LLM que "se cree capaz" de gestionar una queja es un desastre regulatorio y reputacional esperando a pasar.
4. El handoff humano
Cuando el agente escala, la conversación aparece en un panel custom para el equipo de soporte — no como un muro de chat, sino como:
- Un resumen de lo que quiere el cliente
- Los últimos 6 mensajes de contexto
- Los datos de póliza del cliente
- Las 3 siguientes respuestas sugeridas (borradores del agente) que el humano puede editar y enviar
El humano se queda en WhatsApp, el cliente recibe respuesta real en 30 segundos y el agente aprende de las correcciones.
5. El bucle de feedback + observabilidad
Cada conversación:
- Auto-etiquetada por intención
- Auto-puntuada por sentimiento
- Sampleada (5%) para revisión humana
- Agregada en un dashboard semanal que la responsable de atención mira como un halcón
Sin este bucle, todos los proyectos de agentes que he visto se desvían en 8 semanas. Con este bucle, mejoran cada mes.
Lo que falló (la lista honesta)
Cada proyecto tiene cicatrices. Tres reales de éste:
- Semana 4: el agente empezó a recomendar coberturas que no existían en ciertas pólizas nicho. Causa: PDFs desactualizados en el corpus. Arreglo: un pipeline de "frescura de contenido" que marca cualquier documento sin revisar en los últimos 12 meses.
- Semana 7: un cliente escribió 6 mensajes emocionales seguidos sobre un siniestro denegado. El agente seguía intentando "ayudar" en vez de escalar. Apretamos los triggers de escalado — cualquier cosa emocional + relacionada con siniestro = handoff inmediato.
- Semana 11: descubrimos que el agente respondía correctamente pero con un tono que sonaba robótico a clientes mayores. Añadimos un pequeño prompt de "calidez" (
"Eres cálido y empático, usas frases como '¿le puedo ayudar con algo más?', evita lenguaje técnico") y volvimos a auditar el sentimiento. La nota pasó de 6,4 → 8,2.
Resultados a 5 meses
Con el sistema corriendo sobre el 80% de las conversaciones de entrada:
| Antes | Después (mes 5) |
|---|
| Tiempo de primera respuesta | 4h 20min | 38 seg |
| Tiempo de resolución total | 2,1 días | 8 min |
| Conversaciones / mes | 7.200 | 18.400 |
| % resueltas sin humano | 0% | 63% |
| CSAT (1–10) | 6,8 | 8,7 |
| Coste por conversación | 4,10€ | 0,31€ |
| Plantilla de soporte | 9 | 9 (sin despidos) |
| Reasignados a upsell | 0 | 3 |
| Revenue cross-sell desde WhatsApp | 0€ | 84.000€ / 5 meses |
Tres cosas a resaltar:
- Nadie fue despedido. Tres de las nueve personas de soporte se reentrenaron como customer-success haciendo outreach proactivo (que el agente les surface como oportunidades). Encantados.
- Coste por conversación bajó 13x, pero el número de conversaciones casi se triplicó — porque ahora los clientes inician. La línea de "coste de soporte" subió, pero ya es un centro de beneficio.
- El NPS pasó de +22 a +51 en 5 meses. Nunca habíamos visto el NPS moverse así de rápido en una empresa de 240 personas.
¿Tu negocio debería hacer esto?
Tres preguntas — sé honesto:
- ¿Tus clientes te contactan más de 300 veces/mes? Por debajo de eso no tienes el volumen para justificar el coste de set-up. Empieza con WhatsApp Business + plantillas inteligentes.
- ¿Es 80%+ de tu soporte repetitivo o informativo? Si tu soporte es realmente complejo, novedoso, emocional o regulado, la IA es la capa equivocada a añadir. Mejora primero las herramientas de tus humanos.
- ¿Tienes conocimiento interno limpio y documentado? Un agente sobre docs malos es solo una forma rápida de dar respuestas malas. A veces el primer proyecto es "arregla tu base de conocimiento" y después desplegar el agente.
Si puedes responder sí a las tres, el ROI de este tipo de proyecto es, francamente, vergonzoso.
Una lista sobria de "todavía no"
Rechazamos 5 proyectos en 2025 de empresas que querían esto y no estaban listas. Las señales:
- Querían que el agente "sustituyera totalmente" al soporte humano → bandera roja, nunca funciona
- No tenían documentación interna → arregla eso primero
- No estaban dispuestos a comprometer una persona a la revisión mensual → se pudre
- Sus volúmenes eran demasiado bajos → usa plantillas, no agentes
- Querían gestión 100% autónoma de quejas → no es legal en España en sectores regulados, ni recomendable en ningún sector
Si rechazamos un proyecto, normalmente les apuntamos a hacer primero un upgrade de "WhatsApp Business + Plantillas" durante 4 semanas, y revisar la IA cuando los volúmenes lo justifiquen.
¿Quieres un estudio de viabilidad para tu negocio?
Hacemos estudios de viabilidad de 2 semanas gratis si encajas en el perfil de volumen (300+ contactos/mes, B2C o B2B servicios). Salida: un informe escrito honesto con arquitectura, proyección de coste, modelo de ROI y recomendación "sí / aún no / no". Preferimos perder el proyecto antes que construir algo que no va a funcionar.
Pide un estudio de viabilidad o descubre nuestros servicios de agentes IA.
Tus clientes ya están en WhatsApp. La única pregunta es si están hablando contigo o con tu competencia.