全国[切换]
  • 首页
  • 求职
  • 校招日历
  • 宣讲会
  • 心动offer直播间
  • 去留学
我要招人

VLA/VLM算法实习生

面议

实习
  • 视觉-语言-动作(VLA)多模态大模型
  • 天河区
  • 本科
  • 5天
  • 3个月

更新于2026-05-16 01:00

在线简历
上传附件简历
职位诱惑
  • 五险一金
  • 晋升空间大
岗位职责:

职位描述:

1、参与视觉-语言-动作(VLA)多模态大模型的研发与迭代,提升模型在自动驾驶场景中的感知、推理与决策能力;

 2、探索端到端自动驾驶架构,打通从传感器输入到控制输出的全链路学习;

 3、优化VLM大模型的物理世界理解能力,支持开放词汇检测、场景描述与空间推理;

4、研究VLA与自驾Planning模块的融合方案,推动从预测轨迹到可执行动作的可靠映射; 

5、与工程团队紧密协作,支持模型在车端的高效部署与在线验证。

职位要求:

1、27届-28届毕业同学,计算机/人工智能/机器人等相关专业,硕博优先;

 2、扎实的深度学习基础,熟悉Transformer、ViT、LLaMA等主流架构,具备多模态模型训练经验;

 3、熟练掌握PyTorch,有大规模模型训练与调优的实战经验;

 4、有RT-2、OpenVLA、PaLM-E等VLA模型研究或复现经验,或参与过端到端自动驾驶项目(如UniAD、VAD、FusionAD)优先;

 5、熟悉GPT-4V、LLaVA、Qwen-VL等视觉语言模型,有指令微调、RLHF经验者优先;

 6、有自驾Planning经验,熟悉基于学习或优化的规划方法(模仿学习、模型预测控制、图搜索),有实车或仿真验证经验者优先。



其他信息

招聘人数:1人

截止日期:长期有效

工作地址
广东省广州市天河区岑村丰庄大街10号2层208室
企业详情
  • 民营企业
  • 1000人以上
  • 制造业
职位发布者

蔡武亮

浏览足迹

反馈