全校师生:
为营造良好学术氛围,提升我院相关科研团队教学、科研能力,定于2022年7月2日(星期六)以线上线下结合的形式举办举办实验室2022年上半年学术会议(腾讯会议号:488-526-911)。本次讲座由省部共建藏语智能信息处理及应用国家重点实验室主办。现将有关事项通知如下:
报告:语⾔资源建设与机器翻译
报告人:宗成庆 研究员,中国科学院自动化所
会议时间:2022年7月2日(星期六)上午11:30
会议地点:城西校区理科楼129室
报告摘要:统计机器翻译和神经机器翻译都属于数据驱动的机器翻译⽅法,其翻译性能在很⼤程度上依赖于双语平⾏语料的规模和质量。那么,对于资源匮乏的语⾔来说,要实现⾼性能的机器翻译系统便面临更⼤的挑战。如何借助互联⽹内容自动获取语⾔资源,如何清洗和筛选双语平⾏句对,如何在语⾔资源不够丰富的情况下研发机器翻译系统,成为当前学术界和企业界共同面对的难题。本报告将在简要分析机器翻译技术现状的基础上介绍 两种低资源语⾔与汉语之间对齐语料的筛选⽅法,然后介绍⼀种参数分化与适配器相结合的机器翻译⽅法,最后对机器翻译与资源建设研究未来的发展提出自⼰思考和建议。希望本报告内容对于我国少数民族语⾔资源建设和机器翻译技术研发具有⼀定的参考价值。
报告人简介:宗成庆,中国科学院自动化所研究员、博⼠⽣导师,ACL/ CAAI/ CCF Fellow。他主要从事自然语⾔处理、机器翻译和语⾔认知计算等研究,发表论⽂200余篇,出版专著三部、译著两部。目前担任国际计算语⾔学委员会(ICCL)委员,中国中⽂信息学会副理事长,学术期刊ACM TALLIP副主编和IEEE IS编委等。曾任亚洲自然语⾔处理学会 (AFNLP)主席,国际⼀流学术会议ACL 2015和COLING 2020程序委员会主席、ACL 2021⼤会主席。荣获国家科技进步奖⼆等奖和多个省 部级及国家⼀级学会的科技奖励,获得北京市优秀教师、中科院优秀 导师和李佩教学名师等荣誉。享受国务院特殊津贴。