具身VLA 算法工程师/专家

📍 杭州市⏱️ 不限🎓 不限 👁️ 1次浏览
薪资面议

岗位职责

一、模型研发与优化: 1、负责视觉语言行动模型(VLA)和视觉语言模型(VLM)的研发,结合视觉、语言和动作、触觉等多模态,实现从多模态输入到机器人动作输出; 2、设计和优化模型架构,完成模型的数据处理、训练以及真机部署工作,确保模型的高效性和准确性; 二、技术研究与创新: 1、跟踪 VLA/VLM 领域的最新技术动态,如流匹配、动作分块架构等,探索新的模型架构和算法优化方法; 2、深入调研具身智能领域相关的前沿技术,探寻将最新技术应用到具身智能领域的可能性; 三、数据处理与预训练: 1、参与大规模多模态数据集的收集、处理和标注,为机械臂模型训练提供高质量的数据支持; 2、设计具身智能领域多模态数据的采集、清洗与增强策略,建立高效数据管道; 3、负责、参与通过仿真软件进行丰富的数据生成,以提升具身模型的泛化性; 四、系统集成与部署: 1、负责、参与算法在真实机器人平台的工程化部署; 2、负责、参与模型在仿真平台的仿真验证。