Job description
大模型算法工程师上海正式职位描述1、大模型高效微调方法,包括数据采样与增强、微调技术探索等,持续提升模型的知识覆盖、推理、工具调用,长文本,RAG等相关能力;
2、大模型对齐方法,包括对齐策略迭代、奖励模型优化、数据构造与优化等,提升模型在安全、可信,风格等方面的表现;
3、探索前沿的大模型相关技术,包括但不限于MoE、原生多模态、长文本技术、智能体构建等,并将前沿技术应用在业务中;
4、视觉-语言模型(VLM)优化方法,包括视觉-语言的特征对齐、VLM的优化和评估等。职位要求1.硕士及以上学位在读,计算机、软件工程相关专业优先;
2.具备优秀的算法能力,有TensorFlow/PyTorch等深度学习训练框架相关经验,熟悉DPO、PPO、RLHF相关算法技术;
3.扎实的编程基础,熟悉PyTorch深度学习框架及任一深度学习框架;
4.熟悉语言模型和预训练模型的基础原理,有相关方向的经验,有相关顶会论文优先;投递
