来自英属哥伦比亚大学和美国加州大学伯克利分校的研究人员,使用一个新的计算机系统在短时间内拟构了一组原始母语(Protolanguages)。与语言学家费时费力人工拟构的结果相比,系统的准确率达 85%。研究结果今天在《美国国家科学院院刊》(PNAS)上发表。
论文的主要作者、英属哥伦比亚大学的统计学助理教授亚历山大•布沙尔-柯特(Alexandre Bouchard-Côté)说: “我们希望我们的工具将彻底改变历史语言学,就像统计分析和计算机的力量彻底改变了演化生物学的研究那样。”
他说:“系统并不会取代在行的语言学家细致入微的工作;但颇有价值的一点是,它可以增加语言学家使用的现代语的数量,也就是他们拟构的基础。”
历史比较语言学认为,现代具有亲属关系的语言在历史上源于一种语言,这种语言就是它们的母语。原始母语的拟构(reconstruction),就是将现代的亲属语中拥有共同意义的词分组,分析这些词的共同特点,然后根据音调变化等规律,推导出共同的母语。
布沙尔-柯特和美国加州大学伯克利分校的同事一起研发了这个新的工具,它能分析声音在基本的语言单元这一层面的变化,运算规模也比以前的电算化工具要大。
拟建使用的数据库包含1.42万多个词形,来自637种南岛语系(Austronesian)语言。南岛语系主要分布于东南亚和太平洋地区,是现今世界上唯一主要分布在岛屿上的语系,包括大约1300种语言。台湾是南岛语系的源头,目前是人口分布上的地理最北端。
信息来源:EurekAlert!
文章图片:io9.com