首页 > 数码 > 正文
分享到:

融资百亿元后,首颗国产全功能GPU研制完成

时间:2022-08-29 17:18:31 来源: 评论:0 点击:0

  给我100亿,我要造一个超越英伟达的国产GPU,这事你信吗?

  看似天方夜谭的事情,正在中国真实发生着。

  近两年,国产初创GPU公司累计拿下了超百亿的融资,成立18个月的壁仞科技融资总额超过50亿,摩尔线程一年融资30亿,沐曦集成电路第五轮融资10亿元,天数智芯拿下10亿元C轮融资。

  这样的巨额融资,看的出资本市场坚信国产GPU光明的未来,比融资额更吸引人眼球的,是国产初创GPU的豪言壮语。

  摩尔线程在不到300天的时间里,宣称完成了首颗国产全功能GPU的研制,纸面算力相当于2016年推出的英伟达GTX 1070。

  壁仞科技更为激进,不到3年时间就推出了首款通用GPU产品BR100系列,宣称其旗舰产品的峰值算力超过了英伟达目前在售的旗舰计算产品A100 GPU的3倍。

  刚刚登陆科创板的龙芯中科则在招股书中称,募资额中的12.58亿会投入先进制程芯片研发及产业化项目。

  其实,这并不是中国造芯第一次让人看到朦胧的希望。新世纪以来,中国投入大量人力与财力,试图在消费级CPU领域取得突破,却诞生出“汉芯”这种骗取上亿元科研基金的闹剧。后来,华为多年的卧薪尝胆,终于让海思芯片在智能手机领域拥有竞争力,但被封锁后再次无以为继。

  但不管有多难,这一次,中国造芯的步点已经踩在了GPU上,为什么是GPU?这会是一场资本泡沫吗?能成功吗?在我们看来,中国自主研发GPU,有必要,有机会,但也难度巨大。

  首先,国产GPU有必要,但不是让你买回家打游戏用的。普通用户对显卡的需求无非是打游戏或者渲染视频。

  然而除此之外,在眼下的科技行业,GPU正显得越来越重要。相较于CPU,GPU拥有更多计算单元,这让它适合用于数字货币“挖矿”,也更适合用于人工智能深度学习。由于AI的深度学习都要跑海量数据,所以GPU往往比一般CPU更有效率。

  像当下的大风口自动驾驶,就离不开深度学习在图像识别领域的应用,如果说自动驾驶是智能汽车行业的基建,那GPU就是这个基建的基建。其它领域里,从普通人生活中的人脸识别、智能音箱,到下围棋的阿尔法狗、大片里的演员换脸,也都需要AI通过GPU进行深度学习。

  GPU扛把子英伟达的财报就显示,他们增长最迅猛的业务当属数据中心。2021全年收入67亿美元,同比增长高达124%。这项业务的核心硬件基础之一就是A系列服务器。

  这个数据中心其实就是英伟达提供算力,帮助企业进行AI训练的,从公开材料中可以看到,提高微信搜一搜的搜索效率,部署智能交通预警平台,医疗领域的基因测序等等,都是由英伟达的GPU来提供算力支持的。

  特别是自动驾驶领域,英伟达也处于领先地位。自动驾驶算法公司可以用英伟达的GPU进行研发加速,整车企业则可以直接购买内置GPU的英伟达自动驾驶芯片,老黄这次又赢麻了。

  目前中国人工智能行业可以说方兴未艾,如果在重要行业的基础设施上过分依赖外国芯片公司,大概并不是一件值得过分称道的事情。毕竟类似断供、后门这样的负面词汇,我们听过了太多。

  总而言之,在未来充满太多不确定性的情况下,中国的GPU创业潮难度虽大,但还是非常有必要的。

  而跟过去20年一直在说的国产CPU相比,国产GPU除了有必要,还有可能。

  其实早在1994年,当时联想的总工倪光南提出要造国产CPU开始,方舟、龙芯、申威和飞腾等公司相继开展研究,而他们遇到的最困难问题之一就是,拿不到x86架构的指令集授权。

  大家常用的电脑程序都使用英特尔x86架构的指令集,没有它,国产CPU就不能运行这些程序,即使能运行,效率也低。

  打个简单的比方,指令集就好比乘法口诀,英特尔有这本乘法口诀的版权,不让其他企业使用,没有口诀算个5×7,都要掰手指头算半天,更何况CPU是算的是“6378×122.6”。

  但事情在GPU上发生了变化。一方面,与CPU基本被x86架构统治不同,GPU初创公司可以拿到一些国外芯片设计公司的公版架构设计。

  江湖传闻,这一轮国产GPU创业潮,就与拥有中资背景的英国芯片设计公司Imagination放开授权,拥有一定联系。这家公司手上有相当多成熟的GPU设计方案。

  另一方面,做GPU对指令集的依赖稍小,而相对较为重要的API接口方面,国内公司是比较轻松可以获取的。API接口可以起到连接应用程序和显卡驱动的桥梁作用。

  所以从拿到入场券的角度来看,GPU确实比CPU要容易一些。除了入场券,国产GPU的可能性还体现在核心结构上。

  刚才说过,GPU具有大吞吐并行计算方面的优势,但相对的,它远不如能理解上万指令的CPU“聪明”,通常只能理解十几种指令种类。这也就意味着,相比有着更多控制单元、缓存单元,以及更复杂计算单元的CPU,GPU的控制和缓存单元更少,整个GPU核心大约90%都由数目巨大的计算单元组成,设计难度相对较低。

  说到这,国产GPU有必要,有可能,但同时也有很大难度。

  GPU是典型入门容易毕业难的行业,近期英特尔时隔24年重回独立GPU市场,拉开架势发布的新品,表面看叠了不少buff,实际到了最考验功底的驱动程序方面,却被英伟达按在地上摩擦。

  所以对于新品牌的显卡来说,参数的意义往往有限。

  要知道,2021年英伟达仅在显卡驱动测试工作上的投入就高达180万小时。

  而多年近乎垄断的行业地位,形成了很强的生态效应,让软件开发商更愿意为N卡进行针对性适配。

  比如游戏的“次时代”技术光线追踪,就是英伟达率先引入游戏市场的,效果也比AMD更好;

  专业领域也是如此,像Adobe等专业设计软件使用英伟达显卡时可以开启CUDA加速,从而实现更快的渲染速度。

  再看国产GPU,虽然目前很多厂商的纸面数据,已经可以和英伟达2016年的10系掰掰手腕,但在调试以及软件适配方面的差距,不可能是一朝一夕就可以完成的。

  曾有人拿2019年的景嘉微号称对标GTX 1080的JM7201测试,结果却连英特尔10代酷睿CPU的核显都不如。

  况且在消费级市场,无法有效降低成本的国产芯片,往往价格偏高,就像龙芯、兆芯等国产CPU笔记本一样。

  不过,国产公司也有突破点,那就是企业级GPU市场,以及需要自主可控产品的一些行业。国内B端客户更看重安全性和可靠性,不存在C端那种明显的生态垄断,国产GPU在这方面也已经有了一些成功案例。

  比如近期完成取证试飞不久的国产大飞机C919,用的就是翔腾微电子HKM9000 GPU的航电系统。壁仞科技刚发布的BR100系列GPU,与全球前三的服务器厂商浪潮签约了AI服务器相关协议。芯动科技风华GPU第二代,则获得了中国能建5亿元金额的采购大单。

  所以对国产GPU来说,更现实的是先在B端“打怪升级买装备”,等基础好了,口碑有了,未来挑战老黄苏妈,或许真的就不仅仅是一个梦想了。

  当然对于国产GPU这一轮创业浪潮,也有不少怀疑的声音。有从业者指出,目前国内企业与英伟达、AMD等大厂的技术差距在10年以上,而一块GPU的研发周期从立项到上市至少需要3-5年,拿到巨额融资的国产GPU公司,是否能说服资本保持足够的耐心去等待?

  冷静下来看这件事情,确实有很多魔幻的地方,有些国产GPU公司起步就要对标英伟达最先进的产品,是否步子卖的有些过大;另外大量产品将GPU的制程工艺定在7nm,而这样的生产工艺严重依赖台积电和三星,如果出现华为一样被制裁的情况如何收场?还是要等中芯国际实现7nm的量产?

  这些问题将在国产GPU成长的路上持续存在,不过从一个科技爱好者的角度出发,我们真心的希望在GPU领域,能有中国企业可以站上国际舞台,和巨头们掰掰手腕,希望不远的未来,我们都能用上一块完全来自中国的顶级显卡。