一. 团队介绍
团队专注于研发适用于NLP/CV/Audio/Motion/RelationalData的通用多模态预训练大模型及其下游应用,致力于推动通用AI模型的发展以及AI模型的民主化。团队拥有低碳高效的大模型训练技术积累,于去年发布全球最大的多模态预训练模型M6,并以服务化平台形式得到内部广泛调用。团队于今年2月开源统一任务表示的多模态预训练模型OFA,以同一模型在诸多跨模态任务上实现SOTA。 团队成员背景多样,覆盖NLP、CV、Audio、以及跨模态的多个领域,CCF A类文章超过100篇(NuerIPS/ICML/ICLR/ACL/CVPR/KDD...);团队成员大多来自于清华北大年轻的师兄师姐,团队氛围极佳,无加班文化。
二. 岗位介绍
团队重点围绕下课题进行研发: 1. 领域无关的通用AI模型与系统,提升模型任务宽度,以及模型的生成、表征和组合泛化等关键能力; 2. 预训练基础技术,包括高效低碳的超大规模多模态模型训练方法,轻量化Finetune和部署技术; 3. NLP/CV/结构化数据相关的预训练模型及其下游应用,包括单模态/跨模态问答、推理、生成; 4. Motion/3D视觉相关的预训练模型及其下游应用,包括人脸/手势/身体的动作识别与基于多模态信号的数字人驱动;
三. 职位要求
1. 自驱力强,敢想敢做; 2. 计算机相关专业硕士及博士; 3. 熟练使用python/linux,熟练掌握pytorch/tensorflow/jax至少之一的深度学习框架; 4. 至少有一篇高质量文章发表记录或对岗位相关领域有强大的复现&实战经验;
+ 熟悉大规模预训练技术的同学优先; + 有NLP、CV、Audio、Motion、3D、CG等领域研究背景或者参与过大型开源项目优先; + 有相关领域实习经验或者ACM竞赛获奖者优先;
四. 简历联系
ericzhou.zc@alibaba-inc.com
|