返回列表
AI Infra Engineer(训练平台)
上海
全职
MARI人工智能研究院
矩阵超智 Matirx 是一家开发通用人形机器人的AI人工智能公司。我们的人形机器人Matrix-3专为商业任务和家庭而设计。矩阵超智 Matirx 的使命是打造物理世界的AGI通用人形机器人提升人类潜能。
岗位职责
1.建设算力资源调度、训练任务管理和环境管理能力
2.支持训练过程监控、日志、checkpoint、artifact 管理
3.提供实验记录、结果评估、可重复性调试和对比分析能力
4.持续优化训练效率、失败恢复能力和整体资源利用率
岗位要求
1. 学历背景:本科及以上学历,计算机、软件工程、云计算、人工智能等相关专业。
2. 工作经验:具备AI训练平台、算力调度平台、机器学习平台研发搭建经验,有大模型、具身智能模型训练基建经验者优先。
3. 技术能力:熟悉容器化技术、分布式算力调度、集群管理,了解模型训练流程、训练资源监控、任务容错机制。
4. 业务认知:了解世界模型、价值模型等AI模型训练逻辑,熟悉训练脚本、日志、检查点、训练产物管理规范。
5. 综合素养:逻辑清晰,具备问题快速排查能力,抗压性强,擅长跨团队协作,理解AI训练基建对模型迭代的核心价值。
© Matrix 2026