2020年10月26日,上海燧原科技正式推出搭载燧原科技云燧T10的PCIe Gen4全互联AI高算力训练系统。该系统目前为国内第一套基于PCIe Gen4的全互联AI高算力训练系统,不仅使配备云燧 T10的机内PCIe带宽得以全面提升,同时结合燧原科技GCU-LARE技术可实现系统高性能互联。
PCIe Gen4全互联AI高算力训练系统由上海燧原科技与SuperMicro合作研发,其中,燧原科技云燧系列产品PCIe Gen4的高带宽和GCU-LARE智能互联特点,在此研发中发挥了关键作用。
以该系统的创新技术——GCU-LARE来说,燧原科技GCU-LARE智能互联技术为系统提供了最大提供双向200GB/s的互联带宽。在2D Torus 6x6节点连接方式中,若采用GCU-LARE互联,一个机柜内3台8卡服务器,垂直方向环6个节点,水平方向用2张RDMA/RoCE网卡,通过类似可扩展的连接方式,可以实现千卡级别高线性度互联,其线%以上,远超业内水平,故而实现其高性能互联特色。
燧原科技产品部资深总监Bob Deng表示,随着AI模型的复杂化和大型化,AI算力需求成指数级增长。其中,运算集群和CPU的通信带宽,以及运算加速卡节点之间scale out时的高性能、低延迟、智能化互联成为高算力集群的瓶颈。
此次燧原科技正式推出的PCIe Gen4全互联AI高算力训练系统,便着重解决通信带宽与运算加速卡节点之间的高性能、低延迟、智能化互联问题。
燧原科技通过直接连接PCIe Gen4 x16 CPU至云燧T10,使得Supermicro新的4U A+ Server 4124GS-TNR系统支持最多可8张云燧T10 PCIe AI加速卡,而单机8张云燧T10支持4卡作为一个节点的HCM(Hybrid Cube Mesh)互联拓扑,节点内通过GCU-LARE桥接卡实现4卡间点对点全互联,节点之间通过GCU-LARE高速线缆实现互联,总互联带宽高达800GB/s。最终,该系统无需任何PCIe Switch,便可实现最低延迟、最高带宽和最大限度的加速。
此外,该系统还支持最多两个额外高性能PCIe Gen4扩展槽,且支持单个PCIe Gen4 x8以及最多2个用于RDMA高速网卡提供最高200Gb/s的高性能网络连接,用于实现最先进的2D Torus的高性能AI训练集群互联拓扑。
多方攻克,具有强大算力与超高加速的PCIe Gen4全互联AI高算力训练系统搭载燧原科技云燧T10,应运而生。该系统加速了计算和网络性能,极大的丰富和提升了整个AI高算力训练系统互联拓扑和带宽,为客户带来强大的产品性能和可扩展性,使其拥有前所未有的速度为最复杂的Al网络进行训练。
上海燧原科技正是认可SuperMicro在全球企业服务器先进解决方案上的突出地位,并与其创新性、革命性的研发特理念不谋而合,故而凭借其独创的GCU-LARE互联技术与SuperMicro展开合作,成功地推出了中国第一套PCIE4的多卡AI服务器训练系统,解决了大型AI训练系统互联接口的瓶颈和规模部署的门槛。此次合作的成功还为双方后期深入合作奠定了良好基础,让未来更多基于多卡互联的AI模型训练系统逐一实现。
对于上海燧原科技而言,这款搭载云燧T10的中国第一套PCIe Gen4全互联AI高算力训练系统成功推出,是对其研发方向的极致肯定,同时也彰显了上海燧原科技在训练芯片领域的技术实力与企业地位。
燧原科技联合创始人张亚林先生认为,能与全球企业服务器先进解决方案的倡导者和领先者SuperMicro保持前瞻性技术上的一致,并展开深入合作,最后成功落地合作成果,威客电竞是上海燧原科技走向国际舞台的标志性一步,代表我国训练芯片行业曙光在即,前景远大。
未来,AI训练芯片的算力需求将以每三个月增长一倍的惊人速度增长,而AI应用率到2025年将达80%。急速变化的AI训练芯片技术、产量需求为该领域企业带来了严峻考验,上海燧原科技必将全力践行其研发战略,全面攻克数据分析、深度学习和深度学习推理等多方难题,为真正的算力普惠和应用落地创造价值和铺平道路。(一鸣)
后来,再反思那场对话,吕永龙越来越觉得,城市作为一个以人为主导的生态系统,必须考虑人与自然生态系统之间的关系问题。
在韦布空间望远镜对星系开展的早期观测中,天文学家只能近似测量每个星系的红移,因为他们没有这些星系光谱的详细数据。
能够穿山越岭、过江跨海的盾构机是国民经济建设的重大装备,但超大型盾构机的核心部件主轴承却依赖进口。
人们在社会活动中不断受到周围环境的影响,细胞也是如此。研究组以小鼠为模型,利用新开发的邻近细胞遗传学技术,发现心脏中的内皮细胞在早期胚胎发育过程中会迁移到肝脏。
按照文章份额,2021年生物医学领域的机构五强分别是哈佛大学、美国国立卫生研究院、斯坦福大学、德国马普学会和中国科学院。
数字贸易正成为我国加快建设贸易强国的“新引擎”,也为世界经济复苏与全球贸易增长注入了新动能。
我国综合性太阳探测专用卫星“夸父一号”最新一批科学图像近日在京发布,其中多幅图像质量达到国际领先水平,验证了“夸父一号”3台有效载荷的观测能力和先进性。
12月11日至14日,在浙江杭州举行的首届全球数字贸易博览会上,数字技术让人耳目一新。
近年来,中央、国务院围绕数字中国建设制定了一系列战略规划,相关部门扎实有力推动各项规划实施落地,数字中国建设取得新的重大进展。
走进冬日的东北虎豹国家公园,银装素裹,天地间白茫茫一片,运气好能碰上东北虎沿着公路“闲庭信步”;来到广西北海滨海国家湿地公园,一半是海水,一半是陆地...
美国能源部13日宣布,其下属的劳伦斯利弗莫尔国家实验室科研人员实现了“核聚变点火”,称这一“重大科学突破”将为国防及清洁能源未来发展奠定基础。
各地要继续把接种安全放在首要位置,严格按照《预防接种工作规范》要求,规范组织接种实施。
在山东省济宁市高新区,依托云存储、大数据中心等打造的工业互联网平台体系,在加速制造业数字化转型、推动先进制造业发展方面起到重要作用。
围绕高抗速生南美白对虾新品种选育,中国海洋大学三亚海洋研究院和水产龙头企业共同申报了海南省崖州湾种子实验室的“揭榜挂帅”项目。
近日,走进海口国际免税城,各类商品琳琅满目,威客电竞购物柜台前排起长龙,又恢复了往日的繁忙景象。”来自浙江的林女士得知海南取消落地检的消息后,全家立刻购买了飞往海南的机票。
测试结果显示,独立式太阳能电池每千克可产生730瓦的功率,如果将其黏附在高强度“大力马”织物上,每千克约产生370瓦的功率,是传统太阳能电池的18倍。
实验上仅发现几例这种同位旋混杂的现象,同位旋混杂矩阵元均小于50keV,理论上也基本能解释这些现象。
在载人潜水器球舱研究领域,从“蛟龙”号到“深海勇士”号再到“奋斗者”号,威客电竞中国不断提高关键部件国产化程度,提升自主创新能力。
我国中小企业数量庞大、且充满活力,产业整体数字化转型的主战场,但目前来看,我国中小企业整体数字化水平暂处于较低水平