研究目标
我们面向机器问答任务构建一套标准化的训练、评测数据集。包括三部分工作:构建自然语言问题的拆解、分类体系;根据这套分类体系构建(question,answer,evidence)数据集,覆盖所有可能的自然语言问题类型;基于我们的数据集设计普适的问答模型。
研究任务可拆解为三部分:
1. 自然语言问题拆解分类体系的构建(最关键的一步) 2. 问答数据集标注方案设计,推进数据标注公司进行数据标注 3. 具有通用知识推理能力的问答模型的设计和实现
学者招募计划
本研究依托于清华大学知识工程实验室和智谱AI,并已有 3 名相关方向博士生和 1 名硕士生参与。我们渴望有更多志同道合的同学们一起完成这一工作。我们期望你具有扎实的数理基础、娴熟的编程实现原型的能力和快速学习能力,对自然语言处理或人工智能领域具有一定了解,并对科研充满热情。每周可以投入 3 到 4 日全勤的时间到我们的科研工作里。只要你有足够的能力,从本科低年级到研究生都可以参与到我们研究中来
如果你对我们的研究有兴趣,欢迎通过我的微信号联系我:zijunyao163com
你能获得什么
1. 科研能力增长与科研产出:如果你是一个科研新手,在这里你将可以获得充分指导,完成相对复杂的技术探索,打通科研全流程;如果你已经具有发表顶会论文的经验,我们也可以提供资源,一起在本研究课题下进行实验探索,协同完成论文产出 2. 人脉资源:在这里,你将获得与相关领域的优秀同学和老师交流学习的机会。 3. 经济支持:我们根据你的个人背景和能力,提供 1.5k ~ 8k / mo 的实习工资。 4. 工作环境:我们可以为你在 智谱AI (位于清华科技园) 提供一个工位。
|