来源:机器之心
作者:泽南、小舟
又一名计算机架构大牛获奖了。
今晨,体系结构领域又有好消息传出,刚刚获得杜克大学博士学位的宋凌皓(Linghao Song)收获了 EDAA 最佳博士论文奖。
宋凌皓 2014 年毕业于上海交通大学,获得信息工程专业学士学位,随后进入美国匹茨堡大学攻读电子和计算机工程硕士。2017 年,他进入杜克大学读博,师从杜克大学电子与计算机工程系教授、计算进化智能中心主任、IEEE Fellow 陈怡然教授。在研究生涯中,宋凌皓主要关注机器学习加速器、计算机架构、深度学习应用等领域。
从 2017 年到 2020 年,宋凌皓的研究连续四年出现在了计算机体系结构顶会,IEEE 举办的高性能计算架构国际研讨会(International Symposium on High-Performance Computer Architecture,HPCA)上。在体系结构方向上,ASPLOS、ISCA、MICRO 和 HPCA 被认为是四大重要会议。
据谷歌学术统计,宋凌皓的研究被引用次数已达到800 余次。
2020 年,宋凌皓博士毕业,目前他已成为加州大学洛杉矶分校(UCLA)计算机科学系的一名博士后。
宋凌皓获奖后,陈怡然教授立即发出了祝贺。
EDAA 最佳博士论文奖是欧洲设计自动化协会(European Design and Automation Association)设立的奖项,每年为四个大方向(软件设计和优化,SoC 设计、体系结构,逻辑、物理设计,硬件安全、可靠性)各奖励一人。在宋凌皓之前,曾有多位华人获得过这一奖项。
宋凌皓的博士论文展示了近年来他在深度学习领域里对于异构加速器的研究成果。
论文:Accelerator Architectures for Deep Learning and Graph Processing
论文链接:https://dukespace.lib.duke.edu/dspace/handle/10161/21507
深度学习和图处理两种大数据应用已经广泛应用于许多领域。深度学习的训练对于推理是必不可少的,这一方面尚未得到充分研究。通过数据 forward,误差 backward 和梯度计算,深度学习训练已经成为一种更复杂的处理过程,涉及到更高的计算和通信强度。
然而,将计算分布在多个异构加速器上以实现高吞吐量和平衡的执行状态仍然是颇具挑战性的问题。在该论文中,研究者提出一种原则性和系统性的方法,用于确定多个异构加速器的张量分区以有效地进行训练加速。新兴的可变电阻式存储器(ReRAM)有望用于存储器(PIM)中的处理。为了在基于 ReRAM 的 PIM 加速器中实现高吞吐量的训练加速,研究者提出了 PipeLayer,这是一种用于分层流水线并行性的架构。
图处理的局部性较差,对存储器带宽的需求较高。在常规架构中,图处理会导致大量的数据移动,耗费大量资源。研究者提出了 GraphR,这是第一个基于 ReRAM 的图处理加速器。它遵循 near-data 处理原则,并探索了以较低的硬件和资源成本执行大规模并行模拟操作的可能。
稀疏矩阵向量乘法(SpMV)是图处理的一个子集,它是科学计算的迭代求解器中的关键计算。ReRAM 中的有效加速浮点处理仍然是一个挑战。在该论文中,研究者提出了一种数据格式 ReFloat,和一种支持的加速器架构,用于面向科学计算的 ReRAM 中的低成本浮点处理。
参考内容:
https://www.edaa.com/awards.html
2021年 2 月的第一周,机器之心将携手二十余位 AI 人耳熟能详的重磅嘉宾进行在线直播,通过圆桌探讨、趋势Talk,报告解读及案例分享等形式,为关注人工智能产业发展趋势的AI人解读技术演进趋势,共同探究产业发展脉络。连续七天,精彩不停。
添加机器之心Pro小助手(syncedai 或 syncedproii),备注「2021」,进群一起看直播。