Por qué los lectores pueden notar que tu libro es IA: Estudio de 61.608 historias

Elimina toda señal estilística de una historia — elección de palabras, ritmo de las oraciones, todo ello — y un clasificador aún puede decir si lo escribió un humano o una IA el 93,2% de las veces. Ese es el resultado principal de StoryScope, un nuevo estudio de la Universidad de Maryland y Google DeepMind que analizó 61.608 historias, y apareció en r/WritingWithAI esta semana como una pequeña bomba: 159 votos a favor, docenas de comentarios largos, y una conclusión incómoda para cualquiera que publique ficción asistida por IA. Las señales no están en tu prosa. Están en tu historia. Y editar no las elimina.

⚡ TL;DR – Puntos clave

•StoryScope comparó 10.272 premisas cada una escrita por un autor humano y cinco modelos de frontera (61.608 historias en total) y las clasificó basándose únicamente en decisiones narrativas —estructura de la trama, agencia de los personajes, revelaciones de información, finales—, alcanzando una precisión del 93,2% sin señales de estilo.
•Las grandes señales: la IA declara sus temas directamente (77% frente al 52% de los humanos), evita subtramas (79% de las historias de IA no tienen ninguna frente al 57%), representa la emoción de forma compulsiva como sensaciones corporales (81% frente al 38%), y resuelve todo en un orden cronológico ordenado.
•La edición de prosa de nivel profesional apenas ayudó: la detección cayó del 95,5% al 93,9%. No puedes resolver las decisiones estructurales solo con una edición a nivel de línea.
•Dadas seis versiones de la misma premisa, la historia humana fue la excepción estadística el 57,8% de las veces — la señal humana es la variabilidad, no el pulido.
•La solución práctica está en la fase previa: dominen la arquitectura (subtramas, hilos sin resolver, revelaciones no cronológicas, temas no expresados) antes de redactar, y dejen que la IA trabaje dentro de esas decisiones. Las correcciones estructurales son baratas en la etapa de esquema y casi imposibles después.

El estudio del que Reddit está hablando

El hilo que llevó el estudio a la comunidad de escritura con IA fue publicado en r/WritingWithAI, resumiendo el artículo de StoryScope (los autores también publicaron el código y 51.000 de las historias).

u/kurthertz
r/WritingWithAI

Un nuevo estudio analizó 61.608 historias escritas por IA. Las señales no están en la prosa; están en la propia historia, y editar no las elimina.

«El giro: eliminaron deliberadamente todas las señales de estilo. ¡Ninguna elección de palabras, ningún ritmo de las frases! Solo observaron decisiones narrativas… A partir de la estructura de la historia, un clasificador distinguió entre humano e IA el 93,2% de las veces.»

Ver en Reddit →

La configuración es extraordinariamente rigurosa para este debate. Cada una de las 10.272 premisas fue integrada en una historia (aproximadamente 5.000 palabras) por un autor humano y por cinco modelos — Claude Sonnet 4.6, GPT-5.4, Gemini 3 Flash, DeepSeek V3.2 y Kimi K2.5 — por lo que la comparación es equitativa, usando briefs creativos idénticos. Luego, los investigadores hicieron lo que nadie que discute las em-dashes suele hacer: eliminaron la prosa y se centraron solo en las decisiones que tomó la historia.

Soy el fundador de Automateed (un creador de libros con IA, así que lee mi opinión con ese objetivo), y respondí en el hilo porque este estudio aporta números contundentes sobre algo que vemos constantemente: la diferencia entre los libros que los lectores terminan y los libros que dejan a medias casi nunca reside en las oraciones.

Las señales, clasificadas por cuán claramente te delatan

1. La IA explica sus temas

El narrador afirma abiertamente la moraleja en el 77% de las historias con IA frente al 52% de las humanas, y el diálogo se reduce a un debate filosófico casi el doble de veces (59% frente al 34%). El modelo no confía en que el lector deduzca nada: cada tema recibe un discurso. Los escritores humanos dejan el significado sobre la mesa y permiten que el lector lo capte.

2. La IA no puede hacer subtramas

El 79% de las historias de IA no tienen subtramas, frente al 57% de los humanos. Las historias humanas empiezan en el funeral y se desenvuelven hacia atrás, saltan en el tiempo y deliberadamente dejan cabos sueltos. La IA cuenta la historia desde la primera pista hasta la gran revelación, de forma ordenada, una sola vía, sin salidas. Si tu libro no tiene una subtrama y se resuelve estrictamente de forma cronológica, se lee como hecho por máquina a nivel de esqueleto — por muy buenas que sean las frases. (La estructura se puede ajustar en la etapa de planificación; nuestra guía sobre estructurar una historia cubre los marcos.)

3. "Mostrar, no contar" se ha convertido en una compulsión

Este fue el que más impactó al subreddit. La IA representa la emoción como sensaciones corporales en el 81% de las historias frente al 38% de los humanos: pecho apretado, sudor frío, puños blancos, la respiración que no sabían que estaban conteniendo. Los humanos están mucho más dispuestos a simplemente decir que alguien sintió miedo (29% vs 8%). La regla del taller se interiorizó de forma tan intensa que se invirtió en un "contar" — valdrá la pena recordar la próxima vez que una herramienta sugiera automáticamente manifestar físicamente cada emoción. Nuestro artículo sobre mostrar, no contar cubre cuándo decirlo es realmente la decisión correcta.

4. Las historias humanas son excepciones

La estadística a la que vuelvo una y otra vez: dada seis versiones de la misma premisa, la versión escrita por humanos fue la anomalía estadística el 57,8% de las veces (probabilidad: 16,7%). La diferencia humana no es pulido; es la voluntad de abandonar el camino esperado — la misma conclusión que surgió en otro hilo esa misma semana sobre por qué las historias de IA nunca sorprenden a nadie.

5. Cada modelo tiene una huella

El clasificador podía decir cuál modelo escribió una historia el 68% de las veces. Claude es comedido, respeta la tradición literaria, ama los epílogos y finales tranquilos. GPT impulsa las tramas con chismes y rumores (64% de sus historias) y enmarca los eventos desde años después con reparto coral. Gemini escribe los finales más ordenados y etiquetó el 88% de sus ambientaciones como "desoladoras y opresivas." DeepSeek pre-carga el contexto que los demás retienen. Kimi no tiene rasgos fuertes en absoluto — lo cual es su propio indicio, el centro genérico de la distribución de IA. Si redactas exclusivamente con un modelo y aceptas sus predeterminados, estás publicando su estilo de casa bajo tu nombre.

Por qué la edición no te salva

La parte del estudio que debería cerrar muchas discusiones: los investigadores tomaron historias de IA y las reescribieron con un marco de edición derivado de un escritor profesional que elimina clichés, prosa recargada y exposición redundante — el tratamiento completo de "humanizar el texto". La detección cayó del 95,5% al 93,9%. Un punto y medio.

La razón es obvia una vez que la ves: el clasificador no está leyendo oraciones, está leyendo decisiones. Si se afirma un tema, si existe un subtrama, si la línea de tiempo se rompe — eso se decidió antes de escribir cualquier oración, y ningún paso a nivel de oración los revisa. Cada señal en la lista es una propiedad a nivel de esquema: barata de arreglar antes de redactar, casi imposible después. Esto también explica por qué el flujo de trabajo de "simplemente pásalo por un humanizador" produce libros que todavía se sienten extraños — la misma razón por la que señalamos problemas estructurales como el problema central en 7 errores de escritura con IA que hacen que los libros electrónicos se sientan genéricos.

Qué Reddit tomó de ello

Las reacciones del hilo se clasificaron en tres enfoques útiles.

El enfoque de flujo de trabajo consideró el estudio como una vindicación de una arquitectura controlada por humanos. El patrón más común: usar IA para generar ideas y corregir la gramática, nunca para decidir la historia. Un escritor describió asignar escenas y capítulos a los LLMs para redactar, pero mantener la trama y los golpes emocionales firmemente humanos — "Soy el Jefe de Redacción." Otro establece restricciones negativas explícitamente porque Claude "ama terminar cada sección con algún tipo de lección": sin temas declarados, sin personajes autoconscientes, sin jerga terapéutica, sin discursos.

El enfoque de advertencias sobre el alcance respondió al alcance, con razón. Las historias rondaban las 5,000 palabras — ficción breve de un solo prompt, no novelas curadas — y el género importa: los lectores de romance a menudo quieren hilos emocionales lineales, y las subtramas pueden leerse como relleno allí. El estudio mide lo que hacen los modelos sin supervisión, no lo que produce un equipo humano-IA. Ambos puntos son correctos, y ninguno rescata el flujo de trabajo con un solo prompt.

El enfoque de la comedia pasó la tarde comparando nombres de personajes de IA. Cada usuario intensivo de IA en el hilo había conocido a las mismas personas: Kael, Elara, Voss, Alistair, Vesper. Un escritor lamentó un personaje llamado Alara que había desarrollado durante una década; ahora inutilizable porque se lee como basura narrativa. La convergencia no es solo estructural — llega incluso a la lista de nombres de bebé.

La conclusión que publiqué en el hilo

u/Empty-Recognition-33 (Stefan, fundador de Automateed)
r/WritingWithAI

“La estadística que salta a la vista para mí es la del caso atípico… Así que la señal no es la maldad, es la convergencia. Los modelos muestrean desde la mitad de la distribución de historias plausibles. Lo que sugiere una solución parcial: no pidas «la historia», pide varias interpretaciones deliberadamente divergentes de la premisa y elige la que te asuste un poco… También vale la pena señalar que el resultado de la edición solo probó la revisión a nivel de prosa. Todo lo que midieron (morales declarados, cero subtramas, revelaciones estrictamente cronológicas) es una decisión a nivel de bosquejo, barata de arreglar antes de redactar y casi imposible después. Eso es un fuerte argumento para que el humano posea la arquitectura y el modelo redacte dentro de ella, nunca al revés.”

Ver en Reddit →

La lista de verificación previa al borrador que supera al clasificador

Invierte al revés los hallazgos del estudio y obtendrás una lista de verificación estructural para usar antes de generar un solo capítulo. Cada ítem es una decisión de esquema, y eso es exactamente por lo que funciona:

Dale al libro una subtrama secundaria. Decide las subtramas tú mismo — quién las sigue, dónde se cruzan con la trama principal, cuál queda sin resolver.
Rompe la cronología a propósito. Abre después del desastre. Revela fuera de orden. Haz al menos una decisión estructural que un modelo de primer borrador nunca tomaría.
Prohíbe las morales declaradas. Añade explícitamente la restricción negativa y elimina cada párrafo donde el narrador explique lo que significa la historia.
Raciona las sensaciones corporales. Busca en tu borrador sensaciones de pecho apretado y respiración contenida. A veces el personaje simplemente se siente asustado, y decirlo es lo humano.
Deja cabos sueltos. La tasa de resolución es una señal. Escoge algo con lo que el lector tenga que lidiar.
Elige el tratamiento del caso atípico. Genera varias interpretaciones divergentes de tu premisa y elige la extraña — el método completo está en nuestro artículo complementario sobre lograr que las historias de IA tomen giros inesperados.

Dónde encaja Automateed

Aviso: este es mi producto, por lo que aplique el descuento correspondiente.

Automateed genera libros a partir de un esquema estructurado y aprobado por humanos — capítulo a capítulo, con un estado de la historia mantenido, nunca un único prompt para un manuscrito terminado. Los hallazgos de StoryScope son, para ser sincero, el mejor argumento a favor de esa arquitectura que he visto: todo lo que detecta el clasificador es una decisión que el esquema posee. Si la subtrama, el orden de revelación y el tema no declarado son tuyos, el modelo está redactando dentro de una estructura humana — y la mayoría de las señales en este estudio simplemente nunca ingresan al libro. Lo que la herramienta no puede hacer es hacer que esas decisiones sean interesantes. Esa parte siempre fue tarea del autor, y este estudio aporta 61.608 puntos de datos que dicen que así sigue siendo.

Preguntas frecuentes

¿Puede un lector realmente notar que un libro fue escrito por IA?

Cada vez más, sí — pero no por las razones por las que la mayoría de la gente se fija. El estudio StoryScope demostró que la detección funciona solo con la estructura narrativa (93,2% de precisión), incluso cuando se eliminan todas las señales de prosa. Los lectores pueden no nombrar las señales, pero las perciben como «planas» o «predecibles».

¿Editar o humanizar un texto generado por IA lo hace indetectable?

No de manera significativa, si la estructura fue determinada por máquina. La edición de prosa de grado profesional movió la detección del 95,5% al 93,9% en el estudio. La edición de líneas no puede añadir una subtrama, expresar una moraleja ni reordenar las revelaciones.

¿Cuáles son las mayores señales estructurales de la ficción con IA?

Temas declarados (77% de las historias con IA), cero subtramas (79%), emociones representadas de forma compulsiva como sensaciones corporales (81%), revelaciones estrictamente cronológicas y finales ordenados. Cada modelo añade su propia huella por encima — reconocible el 68% de las veces.

¿Significa esto que los libros con IA siempre son detectables?

No — el estudio midió generaciones de unas 5.000 palabras a partir de un único prompt sin supervisión. Cuando un humano posee el esquema, las subtramas y el orden de revelación y la IA redacta dentro de esas decisiones, las señales estructurales en las que se apoya el clasificador quedan mayormente ausentes. El estudio es un argumento sobre el flujo de trabajo, no sobre las herramientas.

¿Debería revelar la asistencia de IA cuando publique?

Las plataformas cada vez piden más (Amazon KDP exige divulgar contenido generado por IA en la entrega), y la transparencia cuesta menos que verse obligado a ser descubierto. Divulga, mantén la arquitectura humana y enfoca tu esfuerzo donde los lectores realmente lo sienten: las decisiones.