具身VLA 算法工程师/专家
📍 杭州市⏱️ 不限🎓 不限 👁️ 1次浏览
薪资面议
岗位职责
一、模型研发与优化:
1、负责视觉语言行动模型(VLA)和视觉语言模型(VLM)的研发,结合视觉、语言和动作、触觉等多模态,实现从多模态输入到机器人动作输出;
2、设计和优化模型架构,完成模型的数据处理、训练以及真机部署工作,确保模型的高效性和准确性;
二、技术研究与创新:
1、跟踪 VLA/VLM 领域的最新技术动态,如流匹配、动作分块架构等,探索新的模型架构和算法优化方法;
2、深入调研具身智能领域相关的前沿技术,探寻将最新技术应用到具身智能领域的可能性;
三、数据处理与预训练:
1、参与大规模多模态数据集的收集、处理和标注,为机械臂模型训练提供高质量的数据支持;
2、设计具身智能领域多模态数据的采集、清洗与增强策略,建立高效数据管道;
3、负责、参与通过仿真软件进行丰富的数据生成,以提升具身模型的泛化性;
四、系统集成与部署:
1、负责、参与算法在真实机器人平台的工程化部署;
2、负责、参与模型在仿真平台的仿真验证。