9月3日,中国高端芯片设计公司瀚博半导体,在2022世界人工智能大会上发布一系列新产品,并预览了国产7nm云端GPU芯片SG100。
据瀚博CEO钱军介绍,这款芯片具备业界领先的图形渲染性能,拥有世界领先的超高吞吐、超高质量、低延时的编码能力,集渲染、AI、视频于一体,为云游戏、云手机、云桌面、云计算等元宇宙关键性应用场景提供深度优化。同时,SG100还提供世界一流的SR-IOV虚拟化支持,端到端整体提升用户视觉体验。
图源:受访者提供瀚博CEO钱军曾是AMD高管,在创办瀚博半导体之前,他曾带领AMD中国团队设计量产了业界第一颗7纳米图形处理器和第一颗7纳米GPGPU架构的AI芯片。同时,瀚博的核心研发团队也都拥有18年以上高端芯片设计和量产的经验。
这款芯片尚未正式发布。“不久的将来我们会正式发布这款GPU。”钱军表示。届时瀚博将正式进入GPU市场,将基于GPU、AI和视频核心技术带来更多产品组合。
瀚博CEO钱军在发布会现场 图源:品玩 王兆洋摄此外,当天正式发布的产品包括:瀚博统一计算架构、全新数据中心推理卡载天VA10、边缘AI推理加速卡载天VE1和瀚博软件平台VastStream扩展版。
自主研制的统一计算架构(Vastai Unified Compute Architecture):该架构整合了多款高性能计算引擎,拥有高效统一的存储管理、一致性接口和低链接延迟、完整的虚拟化功能、统一的底层软件设计、模块化的上层计算算子库和功能模块。瀚博统一架构让计算密集型的AI、视频、渲染任务性能得到最大化硬件加速,同时端到端缩小延时,一体化助力云端实时图形渲染、AI增强处理、视频编解码等需求。数据中心产品线:推理卡载天VA10
这款加速卡搭载瀚博自研的超低延时、超高吞吐AI引擎,最大的亮点在于,Int8峰值算力达400TOPS,再次刷新业界纪录。载天VA10功耗150瓦,整体最高推理性能达到同功耗主流GPU的2倍以上,且延时低至后者的6%。在低延时场景(低于4毫秒的YoloV3检测算法场景)下,载天VA10的推理性能,更达到同功耗市场主流GPU的3倍以上。载天VA10适合多种需要高实时性的云端AI应用部署,如直播视频增强、智慧交通管理、实时语义理解等场景。首款面向边缘大算力场景推理卡:载天VE1系列
载天VE1兼具超低时延与超高吞吐率,吞吐率达到主流GPU的2倍,但时延仅为其的1/5。在40~65瓦功耗下,INT8峰值算力达100 TOPS,这款加速卡支持60路1080P视频实时解码,支持主流AI框架的模型,提供从模型编译到推理优化的全流程低代码开发框架VastPipe,软硬结合为客户提供端到端的AI推理解决方案。瀚博的软件平台VastStream:
可加速各类AI应用部署,包括计算机视觉、视频处理、自然语言处理、搜索与推荐、算子自定义扩展等。VastStream的全新软件组件,提供系统管理等三大管理工具,方便客户部署,同时其基础软件栈功能更加丰富,特性包括统一接口、灵活调度、通用AI计算、多路高效视频转码+AI增强、易编程快迁移、工具链完备等。