研究主题:人机对话系统中复杂跨域场景下的Text-to-SQL技术研究
研究内容介绍:
Text-to-SQL通过将自然语言转化为对应的SQL语句,实现对数据库的查询分析。该研究方向可以极大地降低数据查询和增强式分析的应用门槛,减少对底层复杂的数据结构和SQL规则的依赖。利用基于语义解析,多轮对话技术的对话机器人交互方式,可以提高用户使用数据的灵活性和效率。虽然近几年Text-to-SQL方向引起更多的关注,出现了不少基于语义规则,end-to-end方法上的研究结果,在部分场景上的benchmark测试集上也有较大提升(wikisql,acc>90%)。但在小样本跨域数据集,复杂schema关联等影响实际应用效果的问题上,还存在不少问题。结合在不同行业,不同业务场景中遇到的相关技术挑战,拟解决的主要问题有: 1.研究在复杂数据schema关联和跨域数据集下,对多表单轮查询等场景,提升算法表现 2.研究中文语境下,特殊的问题如指代消解,中文与DB Column的映射等研究 3.研究在多轮对话场景下,基于上下文的SQL转换以及无答案问题的检测方法研究 4.探索建立合理的benchmark数据集以及评估标准,统一模型基准(SOTA)
职位要求:
1、计算机相关专业,硕士及以上学历,在读博士生优先; 2、具有自然语言处理、机器学习相关方向研究、实习或项目经历; 3、在ACL,EMNLP等同级别会议,期刊上有论文发表者(一作)优先;
工作地点:杭州,北京
联系方式:
有意者请联系邮箱:lielin.hyl@alibaba-inc.com 也可微信咨询:HYL_1024_Huang
|