【26届校招】大语言模型RLHF算法工程师

🇨🇳Shanghai, Shanghai, China12 days ago

Full TimeZHAsia/Pacific

Application status

Job description

【26届校招】大语言模型RLHF算法工程师深圳、北京、上海正式智能制造 / 工业互联网 / 工业自动化 - 研发智能机器人板块职位描述我们致力于推动强化学习（Reinforcement Learning, RL）在人形机器人运动控制、大语言模型推理优化、和具身智能体（Embodied AI）领域的突破性应用。现招募具备深厚RL技术背景的算法工程师，参与从算法设计、仿真训练到真实场景部署的全链路研发，探索AI与物理世界的深度融合。 1. 研究大语言模型RLHF阶段的广义强化算法，提升大模型的能力，探索大模型的自我进化之路； 2. 研究大模型驱动的智能体算法，包括但是不局限于ReACT、Voyager、WebGPT、AutoGPT； 3. 撰写技术报告和论文，分享研究成果，参与内外部的技术交流和合作，推动团队技术水平的提升，提高团队在行业内的影响力。职位要求1. 具备扎实的机器学习基础和强悍的编码能力，能熟练使用 PyTorch； 2. 对人工智能和大模型技术有强烈的兴趣和热情，愿意不断学习和探索新技术。加分项： 1. 有 ICML、ICLR、NeurIPS、ACL、CVPR 等顶级学术会议发表过有影响力研究成果的优先； 2. 在 ACM/ICPC、NOI/IOI、Kaggle 等编程/AI 比赛获奖者优先； 3. 主导、参与过 AI 相关的有大影响力的开源/闭源项目的优先。投递

Apply on company site

【26届校招】大语言模型RLHF算法工程师

Job description

Similar roles

【26届校招】大语言模型数据算法工程师

【26届校招】大语言模型预训练算法工程师

【26届校招】大语言模型后训练算法工程师（Foundation Model）