,随着经济、文明互动的环球化,干流或通用言语愈增强势,弱势言语正濒临消亡。目前环球上大概有7000种言语,而据言语学家预测大局部将于本世纪末隐没。假设一种言语隐没了,与之对应的整个文明也将随之消亡;如不迭时对弱势言语采取措施,咱们将失去对人类文明遗产完整记载的时机。
妇孺皆知,言语是人类启动沟通交换的关键表白方式,也是文明的载体和关键体现方式,还是一个民族的血脉和精气家园。因此,民族言语(母语),尤其是少数民族言语的包全曾经成为一项关键而迫切的上班,而这方面的上班大有可为。
中国驰名学者周海中先生曾经指出:当今处于弱势的民族言语侧面临着强势言语、环球化、互联网等的冲击,其社会经常使用配置正处于逐渐弱化或隐没的风险境地;包全民族言语,无利于人类文明的传承和开展,也无利于民族勾搭、社会安宁。
包全言语多样性就是包全文明多样性,而包全文明多样性也是包全人类命运独特体的多样性。可以说,民族言语不只是民族存在的很关键的特色之一,也是民族文明传承、开展、兴盛的关键载体,更是人类文明提高和社会谐和稳固的关键标记。
如今,人工默认(AI)在人们看来曾经不再生疏了,大家都已亲自感遭到它对咱们日常生活的影响:人脸识别、语音控制、无人驾驶、默认家居、默认机器服务等;但是其实,人工默认的使命远远不只是繁难人类,更是守护地球文明。
在濒危言语方面,言语记载很大水平依赖人工,但是其结构复杂多变,想要演绎完整的语音变动、语义剖析、语法剖析等,单靠人力是不事实的。另外,被钻研言语的采集、文本转写不足规范也存在许多详细艰巨。
目前,人们正在应用人工默认技术系统地钻研濒危言语,成功对其完整的记载。人工默认技术可树立完善的语料库,记载内容包含:确定该言语的语音结构,剖析该言语的句法结构,基本意义单位和支谣言语的对应相关等。
运用语音识别、语音转写、语音分解等人工默认技术,口音与文字可以更好结合,成功濒危言语的的语音输入。如此一来,即使没有文字的濒危言语,也有条件转换成支谣言语文本,得以记载与传承。
前不久,美国驰名未来学家托马斯·弗雷先生提出了“环球言语档案馆”的想象;在那里,他应用了人工默认技术把不同的民族言语以视频、音频和书面文件的方式存档。他目前曾经联结环球各地的学者搜集了近0种言语的数据,其中许多是濒危语种。
弗雷先生将搜集到的言语资料输入到人工默认言语重建引擎,其能够生成一个配置性的三维平面化身,将言语教授给想要学习它的人。他示意,人工默认引擎将更进一步,填补任何言语空白,在须要时创立一种言语的书面方式,并提供言语之间的翻译。
在中国,科大讯飞应用人工默认技术寻觅濒危言语中不同尺度的音节语义之间的关联和形式,在超强算力的主机的协同配合下,最终构成语音库,成功了濒危言语的留存。仰仗先进的默认语音技术,该公司笼罩多个少数民族言语及方言的语音系统曾经获取实践运行。
中国的阿里巴巴AILabs最近发表,正式成立方言包全专项小组,投入1亿元对汉语方言启动包全和开发。他们将以人工默认为技术手腕,在全国范围内逐渐展开对方言的语音识别、语音分解上班,用科技终身保留方言。
对许多机构来说,保养数字言语数据并使其便于土著社区经常使用是一项应战。而加拿大第一民族文明委员会(FPCC)最近为了允许不列颠哥伦比亚省的土著言语、艺术、文明和遗产的振兴,经过其FirstVoice平台保留言语数据,制造教学程序和运行程序。
另外,First Voice的最新翻新是一款键盘运行程序,可让用户在移动设施上输入超越100种外地言语,包含社交媒体、电子邮件和文字处置。FirstVoices将其言语数据存储在Nuxeo中,Nuxeo是一个开源的云本地内容服务引擎,集成了人工默认和机器学习。
澳大利亚ARC言语灵活出色核心(CoEDL)为了向生活在偏远社区的儿童教授澳大利亚的土著言语,还开发了一种低老本、易于运输的默认机器人Opie。当孩子们经过故事、游戏和课程学习时,Opie的眼睛会与他们互动,机器人会记载下他们的言语技艺,供教员跟踪他们的学习状况。
另外,CoEDL与美国谷歌协作,为土著言语转录和构建人工默认模型,他们目前曾经为20多种澳大利亚土著言语树立了人工默认模型。这要归功于谷歌的开源人工默认平台TensorFlow;这种机器学习技术为言语学家节俭了数百万个小时的时期来转录CoEDL超越4万小时的录音。
由于人工默认技术在言语存储和学习方面的长处,如今它在挽救濒危言语的环节中变得空前关键。不过,想经过这一技术使这些言语得以包全还面临很大的应战,例多么多土著言语普通是经过口述的方式启动传承,假设将其转化为文字,或许会扭转或许无法完整地表白其原本含意。
咱们齐全可以置信,在现代科技,尤其是人工默认技术的助力下,民族言语的包全疑问必定能够得以处置。最后,笔者宿愿有越来越多的人和机构介入民族言语的包全上班,为树立言语生态文明和包全环球文明多样性奉献智慧和力气。