Graphcore宣布获得红杉资本5000万美元投资智能处理单元IPU性能超过Titan X和Xeon E5-2660Graphcore下一步将扩展美国和中国市场11月12日,英国AI芯片研发制造商Graphcore宣布获得红杉资本投资的5000万美元。与生产通用芯片的厂商不同,Graphcore只专注于研发围绕神经网络计算加速的处理器,在2016年10月刚公布A轮融资时就给对外界画了一个饼,说相对于同类AI加速器,他们能提升10-100倍的性能,此外还将在软件层面帮助机器学习开发者更新或舍弃不适宜新型硬件架构的模型与算法。从外界的反应来看,即使他们的硬件产品都没交付客户在实际环境中使用,大家都非常买账,就在两个月前,Graphcore还完成了DeepMind联合创始人、Uber首席科学家、ARM创始人、三星集团和博世等业界知名机构和人士参与的B轮3000万美元融资。一年时间3轮融资已经表明,Graphcore的产品智能处理单元系统(intelligence processing unit,IPU)即将量产,他们需要这笔钱来扩大生产线。作为对外界质疑声的回应,Graphcore于10月公布了三项预备性的基准测试来证明他们的产品确实可以达到预期目标。第一项是CNN模型训练,演示用的是ImageNet数据集来训练ResNet-50图像识别模型,在批尺寸(batch size)为2的情况下,每秒训练1000张左右;批尺寸为4、6、8时逐级提升;但当批尺寸为64时,经过8张IPU C2卡阵列加速,一秒钟即可训练16000张图片,平均下来每张C2加速卡能训练2000张,作为对比,选择单卡功耗同样是300瓦的GPU来加速,每秒钟只能训练约580张图片。第二项测试为长短期记忆(Long Short-Term Memory, LSTM)推断,这是一种特殊的时间递归神经网络,常用于处理序列数据,比如语言翻译或文本转语音类的应用程序。此项测试中,除了使用IPU作为加速器之外,还用到了Poplar库,测试结果同样惊艳,在延迟为2毫秒内每秒能处理4万次推断,5-7毫秒内处理5-6万次推论,作为对比,英伟达P100-PCIE-12GB使用cuDNN 7.0库只有数百次,这是上百倍的差距。第三项测试为生成网络,比拼单位时间内新生成的数据,这里Graphcore使用的是Deep Voice作为测试对象,竞品分别是英伟达GeForce GTX Titan X和英特尔Xeon E5-2660 v3。生成普通质量的16KHz实时数据流,英特尔的CPU和Graphcore的IPU都合格,生成高质量的样本时,则只有IPU能胜任。以上三项测试虽然不能100%反映实际任务中的情形,但已足够证明IPU的潜力,考虑到未来AI加速运算会成为所有行业的需求,则Graphcore越早将IPU量产并投放市场,越有利于他们的技术成为全球智能计算的标准,毕竟AI加速芯片方兴未艾,不管是英伟达、英特尔还是谷歌,都没成为事实上的霸主。这笔资金除用于扩大生产外,会被用来围绕Poplar编程框架建立一个开发者社区,并支持Graphcore美国帕罗奥图的团队去争取他们的首批客户,如医学研究人员、机器人专家、自动驾驶汽车厂商等,再下一步则是拓展中国市场。
Graphcore
Graphcore于2016年在英国成立,是一家AI芯片研发制造商,创始人为Nigel Toon。现任CEO为Nigel Toon。
评论