a&s专业的自动化&安全生态服务平台
公众号
安全自动化

安全自动化

安防知识网

安防知识网

手机站
手机站

手机站

大安防供需平台
大安防供需平台

大安防供需平台

资讯频道横幅A1
首页 > 资讯 > 正文

鲲云科技发布全球首款数据流AI芯片CAISA

鲲云科技在深圳的产品发布会发布全球首款数据流AI芯片CAISA,其定位于AI终端推理,目前已完成量产。
资讯频道文章B

  6月23日,鲲云科技在深圳的产品发布会发布全球首款数据流AI芯片CAISA,其定位于AI终端推理,目前已完成量产。

  根据官方介绍,CAISA搭载了四个CAISA 3.0引擎,具有超过1.6万个MAC(乘累加)单元,峰值性能可达10.9TOPs。该芯片采用28nm工艺,通过PCIe 3.0×4接口与主处理器通信,同时具有双DDR通道,可为每个CAISA芯片提供超过340Gbps的带宽。

  鲲云援引第三方数据显示,搭载CAISA芯片的加速卡仅拥有英伟达同类产品 1/3的峰值算力,但是其通过95.4%的芯片利用率可以实现3倍左右的的实测性能。

  大部分厂商的AI芯片均为指令集的计算架构,此次鲲云科技发布的CAISA芯片则为数据流架构。鲲云表示,数据流架构AI芯片提供较之于指令集架构AI芯片更高的计算效率。指令集的计算架构要求芯片的计算和控制是分离的,而控制过程中模块间的数据移动以及数据计算的过程中会存在等待周期,这会使得芯片的计算模块存在闲置情况,这也是现有芯片利用率普遍低于30%的原因。而数据流架构依托数据流流动次序控制计算次序,采用计算流和数据流重叠运行方式消除空闲计算单元。在实测中,数据流芯片可以与同峰值算力的指令集芯片表现出更高的芯片利用率以及更高的实测算力。

  本次发布会鲲云科技也带来了AI计算平台星空加速卡X3以及X9。

  星空X3加速卡是搭载单颗CAISA 芯片的数据流架构深度学习推断计算平台,为轻量化规格,X3加速卡因此可以与不同类型的计算机设备进行适配,包括个人电脑、工业计算机、网络视频录像机、工作站、服务器等。基于CAISA芯片的X3加速卡动态功耗为20W左右。英伟达边缘端旗舰产品Xavier 在深度学习网络ResNet-50, YOLO v3中实测获得的芯片利用率分别为21.1%、6.8%,而星空X3加速卡的结果为92.3%及82.4%,远高于前者。总体算力表现可以达到Xavier的1.48-4.12倍。

  星空X9加速卡为搭载4颗CAISA 芯片的深度学习推断板卡,峰值性能43.6TOPS,主要满足高性能场景下的AI计算需求。实测性能方面,X9在ResNet50可达5240FPS,与T4性能接近,在YOLO v3、UNet Industrial等检测分割网络,实测性能相较T4有1.83-3.91倍性能提升。最优实测性能下,X9处理延时相比于T4降低1.83-32倍。

  尽管数据流架构显著的提高了芯片算力的利用率,但是指令集的架构支持各式各样的数据组合,具有较强的通用性。CAISA目前工艺水平为28nm,这在晶体管数量、处理速度、温升等方面较之于更加先进工艺的芯片将会存在的劣势。

  鲲云科技认为此次发布的芯片新品的核心竞争力在于提供了更高的算力性价比。

  AI芯片产品不同于SaaS等其他企业服务赛道,用户衡量产品的好坏与否,基本是通过芯片的计算能力、通用性以及价格来进行判断。CAISA芯片的竞争路线不是依靠更大的芯片面积和制程工艺提供更高的峰值算力,而是通过数据流动控制计算顺序来提升实测性能。

  终端推理芯片赛道上,头部厂商英伟达也部署了边缘侧Xavier芯片以及云端旗舰加速卡T4。鲲云科技创始人兼CEO牛昕宇表示,芯片赛道的竞争是简单直接的,要素无非就是算力性价比、通用性以及迁移成本。用户会根据自己的算力需求进行产品筛选,然后比对价格。峰值算力的提升往往来自于工艺技术的迭代以及更大的芯片面积,这也就意味着更高的产品成本。但是此次鲲云CAISA架构带来的芯片利用率提升,并不需要更高的峰值算力从而让用户获得更高的实测算力体现,这可以减少企业所需的制造成本。

  值得关注的是,英伟达凭借其极强的峰值算力以及软件生态构建了极高的竞争壁垒。除了产品在算力上的优势,英伟达凭借产品积累拥有极强的软件生态,现有用户的转换芯片的成本较高。牛昕宇表示,也许初创企业可以选择其他进行拓展,CAISA带来的数据流架构也许就会是下一个方向。

  此外,鲲云将会为用户配备RainBuilder编译工具链,可以支持从算法到芯片的端到端自动化部署,用户和开发者无需了解架构的底层硬件配置。RainBuilder可自动提取主流AI开发框架(TensorFlow,Caffe,Pytorch,ONNX等)中开发的深度学习算法的网络结构和参数信息,并面向CAISA结构进行优化。鲲云希望借助编译工具链提供用户较为方便的部署环境,同时也能完成较为低成本的算法迁移。

参与评论
回复:
0/300
文明上网理性发言,评论区仅供其表达个人看法,并不表明a&s观点。
0
关于我们

a&s是国际知名展览公司——德国法兰克福展览集团旗下专业的自动化&安全生态服务平台,为智慧安防、智慧生活、智能交通、智能建筑、IT通讯&网络等从业者提供市场分析、技术资讯、方案评估、行业预测等,为读者搭建专业的行业交流平台。

免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!
© 2020 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法兰克福展览(深圳)有限公司版权所有 粤ICP备12072668号 粤公网安备 44030402000264号
用户
反馈