Job description
AI算法暑期实习生(LLM/强化学习)北京实习互联网 / 电子 / 网游职位描述1、参与大语言模型(LLM)微调、Prompt优化、RAG检索增强、模型对齐等相关算法研发与落地迭代工作;
2、负责强化学习算法设计、训练调试、效果评估,结合大模型完成DPO、RLHF、强化学习推理优化等相关任务;
3、跟进AI大模型、强化学习领域前沿技术,复现前沿论文算法,落地适配业务场景,优化模型性能与效果;
4、配合团队完成算法测试、数据实验、文档整理,协助推进AI算法项目落地。
职位要求
1. 实习地点:北京
2. 学历要求:硕士研究生(2027、2028届优先),计算机、人工智能、自动化、应用数学等相关专业优先;
3. 技术背景:扎实掌握机器学习、深度学习基础理论,熟悉大语言模型、LLM微调、RAG、强化学习任一核心方向;
4. 技能要求:熟练使用Python,熟悉PyTorch/TensorFlow等主流深度学习框架;熟悉主流开源大模型、强化学习算法者优先;
5. 能力加分:有LLM微调、RAG项目落地、RLHF、强化学习实验、相关顶会论文、竞赛获奖经历者优先;
6. 个人素质:逻辑清晰,具备良好的代码能力和实验复盘能力,主动性强,能够全职实习,可连续实习2个月及以上。投递
