VLA/VLM算法实习生

面议

实习

视觉-语言-动作（VLA）多模态大模型

天河区
本科
5天
3个月

更新于2026-06-30 01:00

在线简历

上传附件简历

职位诱惑

五险一金
晋升空间大

岗位职责：

职位描述:

1、参与视觉-语言-动作（VLA）多模态大模型的研发与迭代，提升模型在自动驾驶场景中的感知、推理与决策能力；

2、探索端到端自动驾驶架构，打通从传感器输入到控制输出的全链路学习；

3、优化VLM大模型的物理世界理解能力，支持开放词汇检测、场景描述与空间推理；

4、研究VLA与自驾Planning模块的融合方案，推动从预测轨迹到可执行动作的可靠映射；

5、与工程团队紧密协作，支持模型在车端的高效部署与在线验证。

职位要求:

1、27届-28届毕业同学，计算机/人工智能/机器人等相关专业，硕博优先；

2、扎实的深度学习基础，熟悉Transformer、ViT、LLaMA等主流架构，具备多模态模型训练经验；

3、熟练掌握PyTorch，有大规模模型训练与调优的实战经验；

4、有RT-2、OpenVLA、PaLM-E等VLA模型研究或复现经验，或参与过端到端自动驾驶项目（如UniAD、VAD、FusionAD）优先；

5、熟悉GPT-4V、LLaVA、Qwen-VL等视觉语言模型，有指令微调、RLHF经验者优先；

6、有自驾Planning经验，熟悉基于学习或优化的规划方法（模仿学习、模型预测控制、图搜索），有实车或仿真验证经验者优先。

其他信息

招聘人数：1人

截止日期：长期有效

工作地址

广东省广州市天河区岑村丰庄大街10号2层208室

企业详情

广州小鹏汽车科技有限公司

民营企业
1000人以上
制造业

职位发布者

蔡武亮

浏览足迹

劳务派遣许可证

广播电视许可证

统一社会信用码

人力资源经营许可证

互联网信息服务业务经营许可证

增值电信业务经营许可证（ICP）

信息系统建设和服务能力认证（CS）

人才服务

企业服务

关于我们

法律信息

服务热线：4008-761-760

易展翅HR APP

易展翅HR助手

战略合作伙伴