前段时间。我们给大家聊过拜登签署芯片法案的事情。美国芯片法案下周签署,专门 “ 封锁 ” 中国?
说它是美国有史以来影响最深刻的法案之一也不过分,多处条款明显针对中国,说白了,人家就是要把我们往死里弄,就看我们撑不撑得住。法案落地之前,美国早已动作频频,先是向中国断供 14nm 以下先进制程的制造设备,还实施了对 EDA 软件工具的出口管制。为了进一步封锁中国,前段时间还发生了让大家彻夜难眠的“窜台”事件,为的就是组建芯片联盟,全面阻断中国的半导体技术发展。这一连串的操作没过去几天,老美的新攻势又来了,有媒体称,英伟达收到美国官方通知,若对中国(含中国香港)和俄罗斯的客户出口两款高端 GPU 芯片 ——A100 和 H100,需要新的出口许可。
同样,AMD 也收到相关的通知,需要对中国区客户断供顶级计算芯片。果然还是来了,在封锁中国高端 CPU 之后,美国盯上了高端 GPU 芯片,进一步打击中国的人工智能产业发展。本来想着躲过了 30 系矿卡的坑,能美滋滋的等 40 系新卡的到来,但美国突然来了一手断供高端 GPU 芯片,这叫玩家们怎么活,难道真把陈年的 750ti 、1060 当传家宝,战一辈子?想换新卡的朋友可以放心了,这次的断供不涉及消费级的高端卡,也就是 4080/90/90ti 等旗舰卡是不受影响的,大家该买还是买。本次断供的高端 GPU 芯片其实是用于人工智能和数据中心的顶级计算芯片。
英伟达这边对应 A100 和 H100 两代旗舰芯片,而 AMD 这边则是 MI100 和 MI200 。由于是商用居多,很多朋友并不了解这些芯片的性能,就拿当前市面上最强的消费级显卡 RTX 3090Ti 来说,它的浮点运算性能达到了惊人的 40 TFLOPS;
对比主流的游戏主机 PS5 10.3 TFLOPS,而强大的苹果 A15 处理器,GPU 浮点运算性能也只有 1.5 TFLOPS ,但游戏性能完全是不用担心的。那么高端 GPU 芯片 H100 能有多强呢?
H100 浮点运算性能达到了 60 TFLOPS,最强的 3090 Ti 在它面前都是弟弟。而且 H100 本来就不是用来玩游戏的,跟消费级的 GPU 来比较,真的是大材小用了。H100 这种高端芯片的价值在于人工智能领域的智能计算工作。拿 2020 年爆火的 GPT-3 人工智能训练器来说,参数规模达到 1750 亿,调用 10000 块 GPU,并花了 30 天才完成训练。这时换上 H100 训练 GPT-3 的话,速度直接提升 6.3 倍,如果用上 H100 自带的新技术,那么训练速度可以提升到恐怖的 9 倍。
看到这里有些朋友懵了,花这么多心思训练出来的 GPT-3 到底能干啥?这个 GPT-3 除了没实体之外,就是大家心目中的人工智能,通过“喂食”(训练)大量的数据之后,它可以做“任何事”。
简单的搜索问题,给出答案这种就算了,高级一点的,例如用户给 GPT-3 说一段需求之后,它会现场生成一个应用程序,解决你的需求。(码农人不好了...)除此之外,更多人性化需求也不在话下,网上很火的线上问诊,只要跟它说你的症状,GPT-3 直接给你整出诊断意见甚至把药都开好了。心情不好的话,可以让 GPT-3 给你写一首歌或者给你编一部创意小说解乏。虽然目前 GPT-3 还不能完全胜任大家对人工智能的需求,但随着高端芯片性能的提升,人工智能的训练效率会有大幅度的提升。那么它就可以完美植入到未来的智能机器人身上,把人类从繁琐的体力劳动中解脱出来。
老实讲就这么一说已经很激动了,真的很期待这样的未来到来。但很遗憾,就在这个时间点,我们中国人工智能的前景似乎蒙上了一层阴影,根据美国本次的规定,本断供不仅仅是 AMD 和英伟达的 2 代旗舰芯片,未来更强大的高端芯片也会一并断供。也就是说除非自给自足,不然是不可能用上国外的高端芯片了。那么目前国产高端芯片发展现状是怎样呢?老狐查了一遍资料,目前天数智芯、壁仞科技、沐曦集成电路、登临科技、摩尔线程等多家公司都有相关布局,但更多的是宣传资料,实物有待商榷。
目前性能最强的是壁仞科技 8 月推出的 BR100 GPU 芯片,采用台积电 7nm 制程,集成 770 亿晶体管,对比 H100 的 800 亿个晶体管,其实差距真不大。根据壁仞科技的发布会,BR100 某些性能更是能反超 H100 ,哪怕实际性能有出入,但作为 H100 的平替,也并不是什么坏事。
美国强力的封锁,一方面限制了我们的发展,但同时也促进了国产替代化的进程,是危机也是机遇。但被美国封死的 14nm 以下先进制程,依旧是我们不得不正视的大问题,哪怕设计工艺再先进,制造工艺跟不上,一切的技术都是纸上谈兵。希望在有生之年能等来国内制造工艺的突破,冲出重围,让中国制造真正的领先于全世界。