Cómo de larga la tenemos, la palabra

enero 5, 2012 § 5 comentarios

Uno de los labs del Molino es el Crucigramador, una herramienta indispensable para todos los adictos a crucigramas. Y cuando uno trastea y ve que se puede darle la longitud a la palabra que quiera, se pregunta ¿cuál es límite de la longitud de una palabra en español? Vemos que el límite está en 32. Seleccionémoslo y dejemos todo vacío, ¿qué nos da? Tetrametildiaminodifenilsulfonas.

tetrame… esa palabra… ¿Y con 31? 2, curioso: el singular de la de 32 y otra más. ¿Y con 30? 3. 1,2,3… ¿Vamos a seguir así, sumándole cada vez una? Evidentemente no. ¿Cómo se comporta el crecimiento y decrecimiento de la cantidad de palabras según la cantidad de letras?
Podríamos seguir usando el Crucigramador y contar los casos a mano, pero preferimos hacerlo de manera automática con la base de datos que alimenta nuestro Crucigramador. Los datos obtenidos los podéis ver en la siguiente gráfica:

La curva en color rojo son formas (corriendo, corrí, luces…), la verde sólo lemas (correr, luz…). Entre 25 letras y las 14 la cantidad de formas se va multiplicando por 2. Sin embargo parece que la cantidad de letras que más formas produce es 10, donde conseguimos más de 100.000 palabras. Desde ese punto se produce una caída en picado tan pronuncianda que con la mitad de letras, con 5, se consigue sólo 14.000 palabras.

Hay que recordar que estos son la cantidad de formas diferentes que existen en la lengua. Desde luego no quiere decir que cuando cogemos un texto la mayoría de las palabras van a tener 10 letras.

Comparando las dos curvas percibimos varios datos; el primero: la enorme diferencia en cuanto a la cantidad de formas y lemas, los lemas son un décimo de las formas. Dicho de otra manera: proporcionalmente cada lema es capaz de producir 10 formas flexionadas distinas. Desde luego eso es mentira, lo cierto es que hay palabras que no da ni un triste fruto (preposiciones, adverbios, etcétera), hay palabras que tienen entre 2 y 4 hijos (sustantivos y adjetivos) y otros que son la grandes paridores de la lengua, los verbos, consiguiendo más de 60 formas hijas sin despeinarse (el lema comer pare: como, comes, comí, comed…).

El segundo dato que conseguimos es que el punto más alto de formas contiene 10 caracteres, mientras que el punto más alto de los lemas está entre 8 y 9 caracteres. Esto no hace más que corroborar el hecho de que la mayoría de las flexiones de una palabra añaden material fónico (que se traducen en caracteres al pasar a la escritura) al lema. Es decir, perros o perritos son formas más largas (con más sonidos o caracteres) que su lema perro. Comeré tiene un caracter más que comer y comíamos tres más.

Etiquetado:,

§ 5 respuestas a Cómo de larga la tenemos, la palabra

  • eosar dice:

    ¡Interesante!

    Por cierto, ¿podrías decirme el área bajo esas curvas? xD Me refiero, a cuántas formas y cuántos lemas tenéis registrados. Me gustaría saber el orden de magnitud de las palabras del español. Es interesante a la hora de compararlo con otros idiomas. Por ejemplo, el inglés seguramente tenga muchos más lemas que el español porque tiene un muy rico vocabulario de procedencia sajona y otro de procedencia latina a través del francés, pero si queremos contar las palabras en total del idioma (incluyendo las conjugaciones verbales) probablemente el español tenga más. Y eso también es riqueza lingüística, ¿no?

    ¡Muchas gracias y un saludo!

  • eumanista dice:

    Hola:
    Pues tenemos casi 700.000 formas y unos 80.000 lemas.
    Lo cierto es que es muy difícil decir cuántas palabras tiene una lengua. Los diccionarios en inglés contienen cientos de palabras que nadie usó nunca (principalmente en latín, como tú dices, por influencia francesa) pero que, al ser reconocidas como cultas, se mantienen en el diccionario…

    Como tú bien dices, la morfología flexiva también es riqueza, sí.

    Saludos!

  • […] Durante muchos años, los lingüistas han mantenido que la longitud de las palabras está relacionada con su frecuencia de uso. Las más cortas tienden a ser las más habituales, y viceversa. Pensemos en los “de”, “a”, “y”, “el”, “que” y en tantos otros cortísimos vocablos que pueblan un texto cualquiera o una conversación. Y reparemos en la rareza de las palabras que tienen más de 15 o 20 letras. Tetrametildiaminodifenilsulfonas, con sus 32 letras, una detrás de otra, pasa por ser la más larga en español, como nos contaba Eumanista en su muy recomendable post Cómo de larga la tenemos, la palabra. […]

  • Escepticemia dice:

    […] Durante muchos años, los lingüistas han mantenido que la longitud de las palabras está relacionada con su frecuencia de uso. Las más cortas tienden a ser las más habituales, y viceversa. Pensemos en los “de”, “a”, “y”, “el”, “que” y en tantos otros cortísimos vocablos que pueblan un texto cualquiera o una conversación. Y reparemos en la rareza de las palabras que tienen más de 15 o 20 letras. Tetrametildiaminodifenilsulfonas, con sus 32 letras, una detrás de otra, pasa por ser la más larga en español, como nos contaba Eumanista en su muy recomendable post Cómo de larga la tenemos, la palabra. […]

  • […] Durante muchos años, los lingüistas han mantenido que la longitud de las palabras está relacionada con su frecuencia de uso. Las más cortas tienden a ser las más habituales, y viceversa. Pensemos en los “de”, “a”, “y”, “el”, “que” y en tantos otros cortísimos vocablos que pueblan un texto cualquiera o una conversación. Y reparemos en la rareza de las palabras que tienen más de 15 o 20 letras. Tetrametildiaminodifenilsulfonas, con sus 32 letras, una detrás de otra, pasa por ser la más larga en español, como nos contaba Eumanista en su muy recomendable post Cómo de larga la tenemos, la palabra. […]

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

¿Qué es esto?

Actualmente estás leyendo Cómo de larga la tenemos, la palabra en Ideas Molineras a medio guisar.

Meta

A %d blogueros les gusta esto: