Desafiando a los detectores: ¿humano o máquina?

Uno de los temas recurrentes en los claustros de profesores es el miedo a que el alumnado copie directamente de una inteligencia artificial como ChatGPT. El hecho de copiar no es nuevo, ya que desde hace ya muchos años Internet ha sido una fuente inagotable de recursos de todo tipo. El problema que aporta la IA es que cada vez que se obtiene una respuesta por parte de la IA, esta es distinta, por lo que no es posible reproducirla de nuevo y aparentemente es única y original.

Los sistemas antiplagio no funcionan adecuadamente y aunque algunos aseguran que son capaces de diferenciar entre lo que ha escrito un humano y una máquina, realmente no existe una certeza absoluta para asegurar que un documento ha sido escrito por una IA y no por una persona.

Hemos hecho una prueba, que no debe considerarse como una evaluación exhaustiva, con un texto generado por una persona y otro redactado por ChatGPT-3.5 Los hemos introducido en varios de los detectores de inteligencia artificial más usados para ver qué probabilidad atribuyen a los textos de haber sido creados artificialmente. Estos sistemas lo que hacen es dar un porcentaje que indica la probabilidad de que el texto haya sido escrito por una IA, es decir, la probabilidad de que constituya un plagio.

A continuación se presentan los textos que se han utilizado para hacer las pruebas.

Texto generado por ChatGPT

El texto se ha copiado tal cual ha sido creado por ChatGPT, sin modificar nada.

El empleo del teléfono móvil en el entorno educativo ha generado un amplio debate. Su presencia en clase, si se gestiona adecuadamente, puede ofrecer ventajas significativas. No obstante, también plantea desafíos. La utilización de teléfonos móviles como herramientas pedagógicas puede mejorar la participación de los estudiantes y facilitar el acceso a recursos educativos en línea. No obstante, es crucial establecer pautas claras para su uso y promover la responsabilidad digital. En resumen, el móvil en clase es una herramienta de doble filo: puede ser valioso si se utiliza adecuadamente, pero requiere una gestión cuidadosa para evitar distracciones y problemas éticos.

Enlace a la conversación.

Texto generado por un humano

Uno de los temas recurrentes en los claustros de profesores es el miedo a que el alumnado copie los ejercicios directamente de una inteligencia artificial como ChatGPT. El hecho de copiar no es nuevo, ya que desde hace ya muchos años Internet ha sido una fuente inagotable de recursos de todo tipo. El problema que aporta la IA es que cada vez que se obtiene una respuesta por parte de la IA, esta es distinta, por lo que no es posible reproducirla de nuevo y aparentemente es única y original.

Los sistemas antiplagio no funcionan adecuadamente y aunque algunos aseguran que son capaces de diferenciar entre lo que ha escrito un humano.

En la siguiente tabla se muestran los resultados. Para que el sistema funcione debe detectar correctamente tanto el texto humano (porcentaje bajo) como el de ChatGPT (porcentaje alto). De lo contrario nos exponemos a falsos positivos, con lo que estaríamos acusando de haber usado la IA siendo falso, como de falsos negativos, estaríamos dando como buenos textos creados por IA. Únicamente Corrector App (una web con un gran conjunto de utilidades para analizar textos) da los resultados algo mejores, aunque insuficientes para tener la seguridad que se necesita en un ambiente escolar y académico.

Comparación entre algunos servicios antiplagio de IA
Servicio antiplagio	Probabilidad de que el texto humano haya sido creador por IA	Probabilidad de que el texto de ChatGPT haya sido creado por IA
Copyleaks	99.9%	99.9%
Smodin	0%	0%
GPTZero	1%	0%
Corrector App	0%	69%
Plagiarismdetector	0%	0%

La conclusión es que los detectores de plagio por inteligencia artificial no son fiables, y una muestra de esto es que desde OpenAI (creadores de ChatGPT) se intentó desarrollar un sistema que detectase su propia inteligencia artificial sin lograrlo. Este proyecto fue abandonado en julio de 2023 debido a la baja tasa de éxito que tenía (Kirchner et al., 2023).

¡Ni ChatGPT ni Gemini pueden detectar los textos creados por ellos mismos!

Por la forma en que se trabajan las IA son incapaces de identificar sus propios textos. Puede realizarse la prueba, se pega un texto y se le pregunta si lo ha creado, en ocasiones dirá que sí y en ocasiones dirán que no, pero nunca hay una base realista bajo estas afirmaciones. Deberíamos evitar situaciones extremas, como el profesor de una Universidad de Texas, que suspendió a toda la clase por haber copiado un trabajo de ChatGPT, cuando no era cierto.

Elaboración propia. *ChatGPT no sabe reconocer sus propios textos* (CC BY-SA)

Un artículo que hace referencia al funcionamiento de estos sistemas sobre detección de plagio lo encontramos tras este sugerente título, Why AI detectors think the US Constitution was written by AI de Benj Edwards para https://arstechnica.com/

Kirchner, J. H., Ahmad, L., Aaronson, S., & Leike, J. (2023, January 31). New AI classifier for indicating AI-written text. OpenAI. https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/