薛念文谈“机器翻译中词义消歧问题”

发布时间:2017-07-18浏览次数:5

 

517日下午,来自美国布兰戴斯大学计算机系的副教授薛念文老师在闵行校区人文楼5303学术报告厅为师生们介绍了他最近在词义表示方面的研究工作对机器翻译中词义消歧问题的看法。本次讲座为思勉人文讲座第346

词义消歧(WSD)作为在自然语言方面受到重点关注的早期问题之一,主要聚焦于解决在上下文中自动确定词义的问题。在本次讲座中,薛念文老师的核心观点是,基于不同的研究目的,传统的词义消歧工作可以被更新的技术替代,甚至可以暂时搁置词义消歧这一复杂模糊的问题。他最近的工作显示,传统的机器翻译采用词语对齐的方式,而这就面临着不同语言语法构式词汇等各方面的差异,最终增加了处理的难度。较新的研究成果主要采用基于神经网络的算法,通过整句对齐的方式进行翻译,从而避开语义分析。由此可以看出,在某些不需要进行语言现象研究的自然语言处理实现过程中,词义消歧完全可以绕开,以便造成不必要的麻烦。

薛念文老师演讲后,来自上海华院数据公司的沈伟林博士也与在场的老师同学们分享了他们正在进行的基于微博内容的个性分析工作。这项工作使用心理学实验对人进行性格分类,然后通过从微博文本中提取语言特征,使用机器学习模型,实现用户进行个性标记,从而有针对性地推送相关内容。在交流环节中,语言学教研室的老师提出可以在语言学方面对于用户的用词习惯,句法习惯进行分析,不仅可以实现大数据处理的目的,也可以扩展心理语言学、计算语言学等交叉学科的研究范围。整场讲座气氛轻松,讨论热烈,在场老师同学们都有了相当的收获。