https://job.toutiao.com/s/iYbTTLtP 职位 ID:A32434 欢迎投递!!!! 职位描述 ByteIntern:面向2025届毕业生(2024年9月-2025年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-知识图谱团队,通过实体挖掘、关系抽取、知识融合等技术手段,将海量的非结构化文本进行结构化建模,构建起了大规模的电商知识图谱,支持电商业务的发展;同时,结构化的电商知识也能融入大规模的预训练模型,进一步提升在各个下游任务上的性能。我们利用这些前沿的NLP技术落地到图谱构建和下游的多个业务场景:商品/短视频分类和属性识别、评价情感分析、短标题生成等。此外,为支持国际化电商业务发展,在多语言、低资源等诸多新挑战下,我们积极探索利用跨语言迁移提升目标语言的模型、利用知识迁移去缓解低资源场景下的标注数据稀缺难点等课题,助力国际化电商知识图谱的快速建设,为业务的蓬勃发展提供助力。
1、知识图谱构建:基于抖音海量的内容数据,挖掘商品、用户、内容标签,构建人货场基础类目/标签/分层知识体系; 2、多语言技术:利用机器翻译、多语言NLP、小样本学习、强化学习等技术,赋能多个海外电商业务; 3、AIGC:基于前沿的AIGC模型能力,帮助降低商家素材制作成本,提升平台优质供给(短视频、图文等); 4、智能导购:利用NLP、CV、多模态技术,增强对短视频内容、图文、商品理解能力,支持搜索、推荐、商城全导购链路,提升消费者在内容场和货架场购物体验; 5、电商行业大模型:挖掘电商垂直领域大规模、高质量pretrain数据集,基于字节通用大模型,研发电商行业大模型,探索电商交互式导购新场景。 职位要求 1、2025届硕士及以上学历在读,计算机相关专业; 2、在NLP、CV、多模态某个领域有较深入的研究,包括但不限于:大模型技术、机器翻译、多语言NLP、小样本学习、强化学习、图像视频理解、多模态等; 3、熟悉PyTorch/TensorFlow其中一种或多种框架模型的训练和部署,了解混合精度训练、分布式训练、TensorRT部署等; 4、有较强的实践能力,在视频内容理解或多模态检索方向有项目经验者优先,在Kaggle、COCO、ActivityNet、ICPC、NOI/IOI等比赛获奖者优先; 5、算法技术领先,在顶级学术会议/期刊发表论文者优先; 6、能与团队融洽合作相处,积极主动有热情。
|