Tu Agente de Content QA No Está Auditando Nada. Solo Está Corrigiendo Comas.
Crees que un agente de calidad de contenido es un corrector ortográfico con esteroides. Que le pasas un artículo, te devuelve los errores de gramática, detecta si hay plagio, y listo. Contenido auditado.
Te has equivocado de diagnóstico.
Llevo auditando contenido publicado desde que lancé conversoriaecnae.es y gestoriascercademi.com. Más de 4.800 páginas indexadas entre ambos proyectos. Y te digo lo que he aprendido: la gramática es la dimensión menos importante que puntúa un agente de Content QA.
El problema no es que tu contenido tenga faltas de ortografía. El problema es que no convierte, no posiciona y no retiene — y tu revisor de Grammarly no te va a avisar de eso.
En 2026, con los LLMs actuales — Opus 4.5, Gemini 3.1 Pro, los modelos de Anthropic — construir un agente que puntúa contenido es trivial. Lo difícil es saber qué puntuar y por qué cada dimensión importa.
Vamos a construir el framework que uso en producción.
---
Las 7 Dimensiones Que Un Content QA Agent Debe Puntuar (Y Por Qué Este Orden)
La mayoría de equipos implementan un agente de Content QA que revisa:
❌ Gramática y ortografía — primero
❌ Legibilidad — después
❌ Longitud — al final
Ese agente no sirve para nada. Literalmente. Te va a decir que un texto está bien escrito cuando está matando tu conversión.
El orden correcto de las dimensiones, de más importante a menos:
1. Claridad de Propósito — La Dimensión Que Mata el Rebote
Tu agente debe responder primero: ¿sabe el lector qué va a obtener en los primeros 10 segundos?
Si un usuario llega a tu página y no entiende en 5 segundos si eso responde a su problema, se va. No lee el artículo. No convierte.
✅ Cómo lo puntuamos: El agente analiza el primer párrafo y el H1. Si no contienen explícitamente el problema que resuelve el contenido, la puntuación de claridad es 0.
En producción, usamos un prompt que evalúa: "¿Un usuario que busca X solución encontraría esto en los primeros 10 segundos?" El LLM devuelve un score de 0 a 10.
2. Alineamiento con Intención de Búsqueda — Donde Muere el SEO Real
Puedes tener el texto mejor escrito del mundo. Si no responde a lo que el usuario buscó, no existe.
Google ya no rankea palabras clave. Rankea respuestas a intenciones. Tu agente debe cruzar el contenido contra las SERPs reales y puntuar si el texto cubre las sub-intenciones que aparecen en los primeros resultados.
✅ Cómo lo puntuamos: El agente extrae las 3-5 preguntas relacionadas que aparecen en "People also ask" de Google y verifica si el contenido las responde explícitamente.
Si el score es menor de 7, el agente rechaza el contenido. No importa lo bien escrito que esté.
3. Estructura de Argumentación — El Esqueleto Que Retiene
El 80% de los contenidos que auditamos tienen una estructura débil. Van de idea en idea sin jerarquía.
Tu agente debe identificar si el contenido sigue una estructura lógica: problema → evidencia → solución → acción. Si salta entre ideas sin conector, la dimensión de estructura falla.
✅ Cómo lo puntuamos: El agente identifica si hay transiciones entre secciones, si cada H2 se sostiene con datos, y si hay una conclusión que resume y empuja a acción.
4. Densidad de Evidencia — La Dimensión Que Construye Autoridad
Un párrafo sin números, sin fuentes, sin ejemplos concretos, es ruido.
Tu agente debe contar cuántas afirmaciones respaldadas hay por cada 500 palabras. Si la densidad es menor de 2 evidencias por cada 500 palabras, el contenido es débil.
✅ Cómo lo puntuamos: El agente busca: cifras, nombres de herramientas, estudios citados, casos reales, capturas de pantalla mencionadas. Si no hay al menos 3 evidencias en un artículo de 1.000 palabras, se marca como "necesita revisión".
5. Accionabilidad — La Dimensión Que Convierte
El contenido más valioso del mundo no sirve si el lector termina y no sabe qué hacer.
Tu agente debe detectar si hay al menos una llamada a la acción explícita (no un "contáctanos" genérico). Un paso concreto que el lector pueda ejecutar en los próximos 5 minutos.
✅ Cómo lo puntuamos: El agente busca verbos en imperativo ("descarga", "implementa", "configura", "abre", "crea") seguidos de un objeto tangible. Si no hay al menos 2 llamadas a la acción específicas, la puntuación de accionabilidad es 0.
6. Legibilidad — La Que Todo el Mundo Mide (Pero Mal)
Aquí sí entra la legibilidad tradicional. Pero ojo: no es longitud de frase. Es carga cognitiva.
Tu agente debe puntuar si el contenido es entendible por alguien con nivel de lectura de 12-14 años. No es "escribir para tontos". Es no perder al 80% de tu audiencia porque usas palabras que nadie usa.
✅ Cómo lo puntuamos: Usamos la fórmula de legibilidad de Fernández-Huerta (adaptación española de Flesch). Pero añadimos un matiz: el agente detecta si hay jerga innecesaria. Si usas términos técnicos que no se explican, baja la puntuación.
7. Gramática y Ortografía — La Última Dimensión y la Menos Importante
Aquí está la clave que la mayoría no entiende.
Un contenido con faltas de ortografía pero con las 6 dimensiones anteriores bien puntuadas funciona mejor que un contenido impecable gramaticalmente pero sin estructura, sin evidencia y sin intención de búsqueda.
No digo que publiques con faltas. Digo que no es el bottleneck.
✅ Cómo lo puntuamos: Corrección ortográfica estándar. Pero el peso de esta dimensión en la puntuación total es del 5%. Literalmente. Las otras 6 dimensiones suman el 95%.
---
El Framework de las 7 Dimensiones de Content QA — Cómo Implementarlo
He llamado a esto El Framework de las 7 Dimensiones de Content QA. No es teoría. Es el sistema que ejecuto en cada deploy de contenido nuevo.
Paso 1: Configura el Pipeline de Auditoría
Usa una Edge Function en Vercel o un cron job en Railway. Cada vez que publiques contenido nuevo — o cada 30 días para contenido existente — el pipeline se ejecuta.
Paso 2: Define los Pesos
| Dimensión | Peso |
|---|---|
| Claridad de propósito | 20% |
| Alineamiento con intención | 20% |
| Estructura de argumentación | 15% |
| Densidad de evidencia | 15% |
| Accionabilidad | 15% |
| Legibilidad | 10% |
| Gramática y ortografía | 5% |
Paso 3: Crea un Sistema de Alertas
No basta con puntuar. Necesitas acción.
Configura tu agente para que cuando una dimensión baje de 5, dispare una alerta a tu equipo de contenido o a tu webhook de revisión.
En gestoriascercademi.com tengo esto configurado contra un canal de Slack. Cada semana recibo un resumen de qué páginas necesitan revisión y por qué dimensión están fallando.
Paso 4: Revisiones Automáticas + Humanas
El agente puntúa. El humano decide.
No dejes que el agente publique contenido automáticamente. Que genere un reporte, y que un editor valide antes de aprobar. El agente es el primer filtro, no el decisor final.
---
Lo Que He Aprendido Auditando 4.800+ Páginas
Los números no mienten.
De las 4.800+ páginas indexadas entre conversoriaecnae.es y gestoriascercademi.com, el 73% de los contenidos que fallaban en las primeras 3 dimensiones (claridad, intención, estructura) tenían una tasa de rebote superior al 70% — independientemente de su calidad gramatical.
El patrón se repite siempre: contenidos perfectamente escritos que nadie lee porque no responden a lo que el usuario buscaba.
El Content QA agent real no es un corrector. Es un guardián de intención.
---
Resumen y Próximo Paso
- Las 7 dimensiones reales son: claridad, intención, estructura, evidencia, accionabilidad, legibilidad, gramática
- La gramática pesa solo el 5% en la puntuación total
- Implementa un pipeline que ejecute auditorías cada 30 días
- No automatices la publicación — el agente puntúa, el humano decide
- Mide rebote vs puntuación, no solo corrección gramatical
El próximo paso que voy a compartir es cómo construir el agente que no solo puntúa contenido, sino que lo reescribe automáticamente respetando las 7 dimensiones. Ese es el salto de auditor a editor.
Pero eso es para otro artículo.
Por ahora, ve y revisa tu último contenido publicado. Pásalo por las 7 dimensiones. Si solo miraste la gramática, no has auditado nada.
Artículos relacionados
- Planning and Reasoning en AI Agents: El Framework de Descomposición Reflexiva que el 95% de Developers Ignora
- Cómo Evaluar AI Agents en 2026: El Harness de 4 Buckets que Detecta Errores Silenciosos
- El 95% de los AI Agents Fallan en Planificación: Cómo Enseñarles a Pensar con Chain-of-Thought y Reflection
- Tu 'Supervisor' de Agentes Es un Microgestor Disfrazado: Por Qué el Patrón de Orquestación Más Usado Fracasa en SMBs
- El 95% de los AI Agents No Son Agents: Cómo Construir el 5% Que Realmente Funciona en 2026
---
¿Quieres recibir contenido como este cada semana? Suscríbete a mi newsletter

