面议
实习更新于2026-05-16 01:00
职位描述: 1、参与视觉-语言-动作(VLA)多模态大模型的研发与迭代,提升模型在自动驾驶场景中的感知、推理与决策能力; 2、探索端到端自动驾驶架构,打通从传感器输入到控制输出的全链路学习; 3、优化VLM大模型的物理世界理解能力,支持开放词汇检测、场景描述与空间推理; 4、研究VLA与自驾Planning模块的融合方案,推动从预测轨迹到可执行动作的可靠映射; 5、与工程团队紧密协作,支持模型在车端的高效部署与在线验证。 职位要求: 1、27届-28届毕业同学,计算机/人工智能/机器人等相关专业,硕博优先; 2、扎实的深度学习基础,熟悉Transformer、ViT、LLaMA等主流架构,具备多模态模型训练经验; 3、熟练掌握PyTorch,有大规模模型训练与调优的实战经验; 4、有RT-2、OpenVLA、PaLM-E等VLA模型研究或复现经验,或参与过端到端自动驾驶项目(如UniAD、VAD、FusionAD)优先; 5、熟悉GPT-4V、LLaVA、Qwen-VL等视觉语言模型,有指令微调、RLHF经验者优先; 6、有自驾Planning经验,熟悉基于学习或优化的规划方法(模仿学习、模型预测控制、图搜索),有实车或仿真验证经验者优先。
招聘人数:1人
截止日期:长期有效
广州小鹏汽车科技有限公司
蔡武亮
HR · 最近登录过