La perplejidad es una métrica utilizada para evaluar el rendimiento de los modelos de lenguaje. En términos sencillos, la perplejidad mide la capacidad de un modelo de lenguaje para predecir una muestra de texto. Cuanto menor sea la perplejidad, mejor predecirá el modelo la siguiente palabra en una secuencia, lo que significa que estará menos “sorprendido” por los resultados reales.