3月17日消息,小米MiMo大模型团队负责人罗福莉与北京大学联合研发出统一的资源管理系统ARL-Tangram,可实现细粒度资源共享和弹性伸缩,将强化学习训练步骤持续时间缩短至多1.5倍,节省高达71.2%的外部资源。该系统已部署用于MiMo系列模型训练,相关论文发表在Arxiv上,罗福莉为通讯作者。这是罗福莉在小米发表的第二份突破性成果。 小米, 团队