近日,美国麻省理工学院林肯实验室超级计算中心(LLSC)发布了超算系统运行记录的开源数据集,旨在帮助科研人员和数据中心运营商探究数据中心优化途径。该数据集涵盖了TX-GAIA超级计算机CPU、GPU和内存使用情况,以及调度日志和物理监测数据,类型包括标记数据、各种已知的人工智能工作负载以及细粒度的时间序列数据,是目前全球同类数据集中最全面的。
此外,为推动对绿色计算的研究,该团队还计划发布TX-GAIA超级计算机操作的环境数据集,其中包含机架温度、功耗和其他相关数据。科研人员表示,超算系统的电源效率有很大的提升空间,类似简单的硬件调整(如限制单个GPU可消耗电量)就可将训练AI模型的能源成本降低20%,而计算时间只会适度增加。
注:本文摘自国外相关研究报道,文章内容不代表本网站观点和立场,仅供参考。