AI Agent数据闭环工程师
职位描述
职责描述:
从战略高度定义车云一体数据闭环的总体架构,使其成为支撑模型周期迭代、跨地域规模化扩张、安全合规可审计的核心基础设施。主导设计高可用、可扩展的车云一体数据闭环系统架构,覆盖从车端数据采集、加密上传、云端接入、预处理、存储、标注调度、训练数据生成到仿真评测回传的全链路。同时探索下一代以AI Agent为中心的数据闭环架构,从战略层面制定架构演进路线图,平衡短期交付与长期技术债,确保架构具备对未来3-5年业务规模的扩展能力。
面向具身智能和模型自训练的发展方向,不断探索AI新技术、数据Infra&工具链开发技术,实现从数据采集、数据传输、数据处理、数据聚类、数据挖掘、数据评测、数据交付、数据效果反馈全链路的高效、高质量流转,实现数据生命周期成本、数据架构和闭环工程体系的持续演进。
1. 负责车云一体数据闭环架构设计与优化:搭建并维护从车端数据上传到云端训练、仿真评测的全链路大闭环系统,确保数据高效、安全地在车端与云端之间流转,支撑模型快速迭代。
2. 构建与维护数据闭环工具链:主导数据处理链路、数据挖掘、采集标注工具、可视化工具等模块的选型、开发与集成,提升数据从原始采集到可用数据集之间的自动化水平与处理效率。
3. 建立数据血缘与版本管理机制:设计并落地数据血缘追踪体系,实现数据从生产、加工到使用的全流程可追溯;建立数据集、标注版本、模型版本之间的严格对应关系,支持问题归因与迭代回溯。
4. 探索下一代以 AI Agent 为中心的数据闭环技术:研究和引入基于 AI Agent 的自动化数据处理与挖掘方法,探索 Agent 在场景识别、标注辅助、仿真用例生成等环节的应用,推动数据闭环向更高阶的智能化演进。
5. 支撑模型开发全周期的数据工作:深入参与模型从数据准备、预训练、微调、评测到上车部署与持续优化的全流程,理解各阶段模型对数据的具体需求,提供针对性的数据策略支持。
6. 定义高质量数据标准并指导数据生产:根据不同模型在不同阶段(如基础能力构建、短板修复、泛化性提升等)的关键需求,明确高质量数据的特征(多样性、代表性、稀缺性、真实性等),指导数据采集、清洗与标注工作,保障模型训练效果。
职位要求
1. 计算机科学、人工智能、自动化、车辆工程等相关专业,硕士及以上学历,3年以上多模态物理AI或AI数据平台相关工作经验。深入理解多模态物理AI数据闭环的架构与流程,有车端数据上传、云端数据处理、训练与仿真集成的一体化实践经验。
2. 优先考虑具备大规模AI训练数据治理经验的候选人,包括数据标准体系建设、数据质量治理、数据资产管理、成本与效率优化,以及海量多模态数据生产与流转体系的落地实践经验。
3. 熟悉数据闭环工具链的搭建与使用,包括数据处理、挖掘、标注、可视化等模块,有相关开发或深度使用经验。
4. 具备数据血缘和版本管理的实际落地经验,理解数据集与模型版本关联的重要性,有数据资产管理意识。
5. 对以 AI Agent 为中心的数据闭环方向有研究或实践兴趣,具备前沿技术探索能力。
6. 熟悉模型开发的全生命周期,深刻理解数据对模型性能(泛化性、鲁棒性、安全性)的关键作用。
7. 能够分析模型在不同阶段的数据需求,具备定义和评估高质量数据的能力,有指导数据生产和标注的经验者优先。
8. 具备良好的跨团队协作能力,能够与算法、工程、标注、测试等团队高效配合,推动数据闭环落地。
投递