Job description
【26届校招】大语言模型RLHF算法工程师深圳、北京、上海正式智能制造 / 工业互联网 / 工业自动化 - 研发智能机器人板块职位描述我们致力于推动强化学习(Reinforcement Learning, RL)在人形机器人运动控制、大语言模型推理优化、和具身智能体(Embodied AI) 领域的突破性应用。现招募具备深厚RL技术背景的算法工程师,参与从算法设计、仿真训练到真实场景部署的全链路研发,探索AI与物理世界的深度融合。
1. 研究大语言模型RLHF阶段的广义强化算法,提升大模型的能力,探索大模型的自我进化之路;
2. 研究大模型驱动的智能体算法,包括但是不局限于ReACT、Voyager、WebGPT、AutoGPT;
3. 撰写技术报告和论文,分享研究成果,参与内外部的技术交流和合作,推动团队技术水平的提升,提高团队在行业内的影响力。
职位要求1. 具备扎实的机器学习基础和强悍的编码能力,能熟练使用 PyTorch;
2. 对人工智能和大模型技术有强烈的兴趣和热情,愿意不断学习和探索新技术。
加分项:
1. 有 ICML、ICLR、NeurIPS、ACL、CVPR 等顶级学术会议发表过有影响力研究成果的优先;
2. 在 ACM/ICPC、NOI/IOI、Kaggle 等编程/AI 比赛获奖者优先;
3. 主导、参与过 AI 相关的有大影响力的开源/闭源项目的优先。投递
