Los autores han reproducido un conjunto de lenguas
originarias a partir de una base de datos con más de 142.000 formas de
palabras, procedentes de 637 lenguas austronesias –del sudeste de Asia, el
Pacífico y parte de Asia continental–. “Identificar las formas de esos idiomas originales permite
evaluar la naturaleza de los cambios en el lenguaje y comprender sus
inferencias sobre la historia humana”, afirman.
Con este modelo han analizado una
antigua hipótesis propuesta por el lingüista Charles Hockett y denominada
“carga funcional” (functional load), vigente desde 1955. Esta teoría sostiene
que los sonidos más importantes para distinguir las palabras tienen una menor
probabilidad de sufrir cambios con el paso del tiempo. “Hemos visto claramente que la mayoría de
puntos en los que hay gran probabilidad de fusión entre fonemas, tienen una
baja carga funcional, es decir, no son sonidos imprescindibles para el
desarrollo de la lengua, lo que prueba la certeza de la hipótesis de la carga
funcional”.
A favor de este nuevo modelo de análisis, los investigadores
aseguran que el 85% de las reconstrucciones obtenidas son idénticas a las que
los lingüistas venían realizando de forma manual en el pasado. “Es poco
probable que el sistema automatizado reemplace a las reconstrucciones
lingüísticas manuales, sin embargo, sí podría ser de utilidad para grandes
reconstrucciones [y] representa un paso adelante en la
aplicación de métodos computacionales para la lingüística”, concluyen.
La investigación se publica esta semana en la revista PNAS:
Alexandre
Bouchard-Côté, David Hall, Thomas L. Griffiths, Dan Klein. “Automated
reconstruction of ancient languages using probabilistic models of sound
change”. PNAS. www.pnas.org/cgi/doi/10.1073/pnas.1204678110