English
中文
返回列表

AI Infra Engineer(训练平台)

上海
全职
MARI人工智能研究院
矩阵超智 Matirx 是一家开发通用人形机器人的AI人工智能公司。我们的人形机器人Matrix-3专为商业任务和家庭而设计。矩阵超智 Matirx 的使命是打造物理世界的AGI通用人形机器人提升人类潜能。

岗位职责

1.建设算力资源调度、训练任务管理和环境管理能力 2.支持训练过程监控、日志、checkpoint、artifact 管理 3.提供实验记录、结果评估、可重复性调试和对比分析能力 4.持续优化训练效率、失败恢复能力和整体资源利用率

岗位要求

1. 学历背景:本科及以上学历,计算机、软件工程、云计算、人工智能等相关专业。 2. 工作经验:具备AI训练平台、算力调度平台、机器学习平台研发搭建经验,有大模型、具身智能模型训练基建经验者优先。 3. 技术能力:熟悉容器化技术、分布式算力调度、集群管理,了解模型训练流程、训练资源监控、任务容错机制。 4. 业务认知:了解世界模型、价值模型等AI模型训练逻辑,熟悉训练脚本、日志、检查点、训练产物管理规范。 5. 综合素养:逻辑清晰,具备问题快速排查能力,抗压性强,擅长跨团队协作,理解AI训练基建对模型迭代的核心价值。

© Matrix 2026