大淘宝-阿里妈妈及商家营销-广告技术部-展示广告算法-rank & 算法平台与效能架构团队- 实习(北京/杭州)求贤若渴
团队介绍: 阿里妈妈展示广告核心算法团队负责广告系统的核心召回和排序算法迭代和创新研发,致力于利用人工智能前沿技术打造超大规模体量下的工业级深度学习框架和创新的解决方案及相应的基础设施,支持阿里定向/展示广告的所有业务和高速收入增长;团队在用户兴趣建模、深度树匹配范式等技术持续深耕,并在工业级领域的深度学习框架上有着深厚的积累。团队成员主要来自国内外TOP院校硕博,和众多知名高校、研究机构保持长期的学术合作,近年在SIGKDD、SIGIR、NIPS、WSDM、CIKM、AAAI等学术会议上发表多篇论文。
我们在做什么:1. 基于阿里海量用户/商家/商品数据,建模用户兴趣,精准洞察用户&商品关系; 2. 针对真实业务场景,发掘现有系统、算法的不足,用技术拓展业务增长空间; 3. 时刻关注前沿技术发展,在业务中落地技术并创新突破技术,我们做的就是走在行业前沿; 4. 针对大规模机器学习问题,探索更高效的基建技术,形成数据算法效能相协同的新迭代范式算法/系统/产品全局思考,推进业务全面协同进步。
团队技术成果2012年 自研MLR算法,开启了互联网领域大规模非线性端到端建模的全新技术路; 2014年 自研XONE分布式机器学习框架,基于大规模稀疏离散特征的MLR算法上线,全面服务于阿里定向广告业务; 2016年 自研面向高维稀疏数据的工业级深度学习框架XDL,构建阿里单体业务最大的GPU训练集群,同期推出了第一代深度点击率预估模型GwEN,引领了深度学习对广告技术的全面革新; 2017年 自研深度兴趣网络DIN全面生产化,自研模型压缩算法Rocket Training&CVR预估模型ESMM上线; 2018年 自研兴趣演化模型DIEN全面生产化,同年牵头开源了包括XDL框架在内的业界首个工业级深度学习解决方案; 2019年 驱动工业级深度学习2.0技术升级大幕的开启,提出并实践算法+系统co-design方**,启动在离线一体化整体迭代架构的新一轮升级,完成用户兴趣中心 (UIC) 和模型银行 (Model Bank)算法体系的建设,自研用户多兴趣记忆网络MIMN并生产化落地; 2019年 自研在线系统柔性引擎Transformers,通过个性化算力分配实现在线算力业务价值最大化; 2020年 自研工业级流式算法迭代系统Bernoulli,加速多模型并行迭代体验与效率;同年自研SIM模型成功落地引领业界长期兴趣建模的潮流,自研CAN模型生产上线完成特征交互方向技术突破; 2021年 自研基于分场景建模的STAR模型和全链路一致性建模技术取得明显提升,开发探索与利用方向AGE技术和样本延迟反馈方向Defer技术,释放模型迭代以外的算法红利;算法平台与效能架构团队与展示广告Match团队共建二向箔算法体系,在召回端以轻量级的方式,真正意义上低引入了任意复杂模型实时打分,取得了显著的业务收益。同时沉淀了低精度量化、大规模Topk、在线复杂索引检索等多种引领业界的大规模召回技术。
我们的每一次技术创新都落地实际业务并驱动了显著的业务增长,同时我们乐于跟业界连接,分享我们的实践经验和成果,推动业界技术的整体前行。
实习职位(Base北京/杭州)算法工程师 or 算法平台工程师
岗位要求1. 计算机、数学、电子工程、通信、人工智能等相关专业; 2. 熟悉常用的机器学习算法,对算法原理及应用有较深入的理解,具备较好的工程实现能力,精通C/C++、Java、Python等其中至少一门编程语言; 3. 在机器学习、数据挖掘、计算广告学等相关领域顶级会议或期刊上发表论文者或者有相应深入研究经历的同学优先; 4. 有过机器学习/深度学习框架或系统平台开发经验的同学优先; 5. 聪明、自信,敢于突破,对技术有执着的追求和热爱;
我们承诺:每一封简历都会被认真评估,综合考查同学的实力。 每一位被面试的同学都会在面试结果出来后得到反馈和建议,反馈建议可能是邮件也可能是电话。 我们乐于与每一位同学长期保持沟通。
简历请发送至 : zhangming.czm@alibaba-inc.com,邮件标题请备注【实习】
以上内容来自官方招人JD,学弟学妹们看迷糊了也可直接加微信沟通,微信号:MingTCZM
快来一起玩耍~
附上近年来团队自主发表的论文:WSDM 2022 : CAN: Feature Co-Action for Click-Through Rate Prediction CIKM 2021 : One Model to Serve All: Star Topology Adaptive Recommender for Multi-Domain CTR Prediction KDD 2021 :Real Negatives Matter: Continuous Training with Real Negatives for Delayed Feedback Modeling DLP-KDD 2021 :What Do We Need for Industrial Machine Learning Systems? Bernoulli, A Streaming System with Structured Designs CIKM 2020:Search-based User Interest Modeling with Lifelong Sequential Behavior Data for Click-Through Rate Prediction DLP-KDD 2020:DCAF: A Dynamic Computation Allocation Framework for Online Serving System DLP-KDD 2020:COLD: Towards the Next Generation of Pre-Ranking System AAAI 2019 : Deep Interest Evolution Network for Click-Through Rate Prediction SIGIR2019 :Lifelong Sequential Modeling with Personalized Memorization for User Response Prediction KDD 2019 :Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction DLP-KDD 2019 : XDL: An Industrial Deep Learning Framework for High-dimensional Sparse Data DLP-KDD 2019 : Res-embedding for Deep Learning Based Click-Through Rate Prediction Modeling KDD 2018 : Deep Interest Network for Click-Through Rate Prediction SIGIR 2018 : Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate AAAI 2018 : Rocket Launching: A Universal and Efficient Framework for Training Well Performing Light Net CIKM 2018 :Image Matters: Visually modeling user behaviors using Advanced Model Server
|