Un método estadístico reconstruye el origen de las lenguas modernas a partir de fonemas

Investigadores de universidades de Canadá y Estados Unidos han desarrollado un sistema automático para crear protolenguas –reconstrucciones probables de una lengua de origen–. El trabajo, que se publica en PNAS, se basa en un método estadístico que analiza los cambios de sonidos en los fonemas y que podría servir para aplicar métodos computacionales a la lingüística.

La información sobre los sonidos y las palabras que aparecen en los idiomas actuales permite a los lingüistas reconstruir lenguas ancestrales. / Gabriel Doyle
La información sobre los sonidos y las palabras que aparecen en los idiomas actuales permite a los lingüistas reconstruir lenguas ancestrales. / Gabriel Doyle

En lingüística, uno de los retos más antiguos ha sido y es reconstruir las palabras de los protolenguajes, es decir, las lenguas originarias de un mismo grupo, a partir de las cuales evolucionaron los idiomas modernos.

Científicos de centros canadienses y estadounidenses han desarrollado un sistema estadístico automático para reconstruir esos protolenguajes. Se trata de un modelo que analiza los cambios de sonido en las unidades básicas fonológicas: los fonemas. La investigación se publica esta semana en la revista PNAS.

“El 85% de las reconstrucciones obtenidas son idénticas a las manuales anteriores realizadas por lingüistas”

“Identificar las formas de esos idiomas originales permite evaluar la naturaleza de los cambios en el lenguaje y comprender sus inferencias sobre la historia humana”, explican los expertos.

La información sobre los sonidos y las palabras de los idiomas actuales permite a los lingüistas reconstruir lenguas ancestrales.

Los autores del trabajo han reproducido un conjunto de estas lenguas a partir de una base de datos con más de 142.000 formas de palabras, procedentes de 637 lenguas austronesias –del sudeste de Asia, el Pacífico y parte de Asia continental–.

Para ello han diseñado un sistema que trabaja directamente con los cambios de sonido en los fonemas gracias a un transductor probabilístico, un aparato que captura los cambios regulares de sonidos y que es sensible respecto al contexto en el que estos se producen.

Los sonidos más importantes permanecen

Con este modelo han analizado una antigua hipótesis propuesta por el lingüista Charles Hockett y denominada 'carga funcional' (functional load), vigente desde 1955. Esta teoría sostiene que los sonidos más importantes para distinguir las palabras tienen una menor probabilidad de sufrir cambios con el paso del tiempo.

“Hemos visto claramente que la mayoría de puntos en los que hay gran probabilidad de fusión entre fonemas, tienen una baja carga funcional, es decir, no son sonidos imprescindibles para el desarrollo de la lengua, lo que prueba la certeza de la hipótesis de la carga funcional”, recoge el estudio.

A favor de este nuevo modelo de análisis, los investigadores aseguran que el 85% de las reconstrucciones obtenidas son idénticas a las que los lingüistas venían realizando de forma manual en el pasado.

“Es poco probable que el sistema automatizado reemplace a las reconstrucciones lingüísticas manuales, sin embargo, sí podría ser de utilidad para grandes reconstrucciones. Asimismo, el nuevo sistema representa un paso adelante en la aplicación de métodos computacionales para la lingüística”, concluyen.

Referencia bibliográfica:

Alexandre Bouchard-Côté, David Hall, Thomas L. Griffiths, Dan Klein. “Automated reconstruction of ancient languages using probabilistic models of sound change”. PNAS. www.pnas.org/cgi/doi/10.1073/pnas.1204678110. 11 de febrero de 2013.

Fuente: SINC
Derechos: Creative Commons
Artículos relacionados