基于知识数据和在线学习的神经机器翻译研究
【项目简介】 近年来,随着深度学习的广泛应用,在数据量充足的情况下,机器翻译都能够实现非常不错的效果,然而在一些资源稀缺、领域、小语种的翻译任务任务上,其表现却不如人意。对此,研究人员在数据策略上进行了多方面的探索尝试,如引入外部知识数据(术语库、数据增强等)、利用实时数据的交互式翻译等,用以提高机器翻译的质量。 在基于知识数据和在线学习的课题中,我们希望探索如何有效的利用外部知识数据做数据增强,如何利用双语字典来生成领域内的双语数据就是一个非常有意义但又颇具挑战的任务,如何准确、可扩展的将已有双语词典嵌入到平行语料库中是该任务的一个难点;此外,我们也希望基于在线学习利用更多的外部数据提升机器翻译效果,如在系统交互的过程中,实时学习译员输入的翻译和引擎提供译文的差异,更新模型,使得类似的翻译错误不会重复出现,提高翻译的一致性。
【领域方向】 自然语言处理
【项目时间】 2020年01月01日 至 2020年12月31日
【项目信息】 工作城市:杭州,北京 毕业要求:2021年01月01日-2024年12月31日毕业的学生
【联系方式】 微信号:wdaylang
|