在过去的几十年里,有一条线贯穿了自然语言处理(NLP)的整个研究范围——知识。机器拥有各种各样的知识,如语言知识、世界知识和常识知识,可以在不同层次上理解复杂的语义。在本文中,我们介绍了一个名为“知识机器学习”的框架,以回顾现有的将知识纳入自然语言处理的努力,特别是最近在中国自然语言处理领域取得的突破。
由于知识与人类语言密切相关,获取和利用知识的能力对机器理解语言至关重要。如附件所示数字在1990年以前,人类形式化的符号知识被NLP研究者广泛使用,如将语法规则应用于语言学理论3.建立专家系统知识库。11990年以后,统计学习和深度学习方法在自然语言处理中得到了广泛的探索,从数据中自动捕获知识,隐式存储在模型参数中。近期预训练语言模型(plm)的成功4,13在一系列的NLP任务上证明了模型中的隐式知识的有效性。充分利用知识,包括对人类友好的符号知识和对机器友好的模型知识,对于更好地理解语言是必不可少的,这已逐渐成为自然语言处理研究者的共识。
没有找到条目