2021年10月19日,一场秋季发布会上,搭载谷歌首款自研芯片 Tensor 的旗舰手机 Pixel 6 系列首次亮相,揭下了面纱的它不再神秘,却留下了更多让人遐想的空间。

谷歌高级副总裁 Rick Osterloh 在发布会上表示,这款芯片是“公司历史上最大的移动硬件创新”,而谷歌CEO Sundar Pichai更是早早地在推特上晒出了Tensor芯片的照片,对于自研项目的自豪感溢于言表。


(资料图片仅供参考)

从开始着手研发,到最终落地量产,谷歌走了整整四年,当我们翻开谷歌的发展史,就会发现,Tensor的发展轨迹,总是围绕着Pixel手机展开,用一体两面来形容它们再恰当不过。

回过头来仔细一想,世界范围内还在坚持自研芯片的手机厂商屈指可数,只有谷歌和苹果还一往无前地走在这条路上,苹果自不用多说,谷歌呢,又是什么支撑着它在芯片上不断烧钱呢?

Pixel意为像素,Tensor代表张量,这两个单词,勾勒出了谷歌自研移动芯片之梦。

一机多芯

说来奇怪,在2017年之前,谷歌还未拥有真正意义上的手机团队。

虽然早在2010年1月,谷歌就携手HTC推出了自有品牌的首部手机Nexus One,但在长达7年的时间里,和LG勾肩搭背,和三星眉来眼去,和摩托罗拉称兄道弟,也和华为牵过小手的谷歌,并没有一支完整的手机研发团队,

所有Nexux手机的后盖上,不止印有Google的字母,也铭刻着其他品牌的logo,与其说这是谷歌自研手机,倒不如说是谷歌版的ODM手机,谷歌负责印字适配系统,顺便提出一堆外观设计上的需求,而其他厂商就专心负责生产手机。

至于谷歌曾经豪掷125亿美元买下的摩托罗拉移动,完全没成为业务核心,收购完成后,谷歌立刻对它挥起了砍刀,全球裁员、精简产品线、关停办事处跟研发中心、退出未能盈利的市场、出售工厂和非核心业务……别的公司收购完成后是修建枝蔓,而谷歌却是开始挖根。

吸收消化完1.7万项专利后,谷歌在2014年又转手把摩托罗拉移动卖给了联想,生产了第一部手机的公司却没有给谷歌带来什么手机硬件上的遗产,此时的谷歌颇有些遗世而独立的味道,笑看众多厂商在手机市场中厮杀来厮杀去,自己专注于软件领域,时不时内部还能孵化出一两个惊世骇俗的新项目,例如曾引起世界瞩目的模块化手机等。

不过当时间往后推移,来到2016年时,情况又不一样了,谷歌看到手机市场节节攀升且利润丰厚时,也不免有了些心动,尤其是在北美市场中,高端安卓旗舰三星一家独大,其他厂商的份额快速缩小,这种送上门来的机会,让谷歌重新思考起了整合软硬件的可能性。

2016年4月,谷歌挖来了摩托罗拉全球总裁Rick Osterloh来担任硬件主管一职,正式启动了自研手机的项目,这次目标直指高端手机市场,尤其是苹果的iPhone,Osterloh在采访中丝毫不掩饰谷歌在这方面的野心:“我们的重点是努力推动用户进入 Android 生态系统,尤其是在高端市场。”

2016年10月,Google Pixel手机登场,Pixel即为像素,代表了这部手机具备的强大影像功能,谷歌在发布会上强调,DxOMark 将 Pixel 评为了当年的最佳智能手机相机,其中归功于谷歌改进的 HDR+ 技术,在Google Pixel 上,相机应用会在用户打开时立即捕获照片缓冲区,以显着减少快门延迟,大幅改善了用户拍摄的体验。

由于Pixel初代推出的稍有匆忙,销量也不尽如人意,但一时的失败并没有让谷歌感到气馁,从这款手机上收获的反馈,反而坚定了它继续走全新硬件战略的信心,2017年9月,谷歌以11亿美元的价格,收购了代工Pixel的HTC移动设备部门,全力押注即将推出的Pixel新款手机。

2017年10月,Pixel 2系列正式发布,搭载高通骁龙835的它与上一代Pixel相比,硬件上升级的地方并不多,但在谷歌官方的新闻稿中,着重强调了一件事,Pixel 2和Pixel 2 XL上不仅有一块三星代工的SoC,还有一块由谷歌自研的协处理器——PVC(Pixel Visual Core)。

谷歌表示,Pixel 2的摄像头配备了出色的硬件、软件和机器学习,用户只需对准摄像头拍摄,就能拍出令人惊叹的照片和视频。其中HDR+是帮助拍摄出色照片的技术之一,它能让用户在从光线昏暗的风景到阳光明媚的天空等亮度范围较大的场景中拍摄出出色的照片,而为了扩大 HDR+ 的应用范围,处理最具挑战性的成像和机器学习应用,并提供更低延迟和更省电的 HDR+ 处理,PVC应运而生。

具体硬件方面,PVC的核心是 Google 设计的图像处理单元 (IPU),其拥有 8 个谷歌设计的定制内核,每个内核都有 512 个算术逻辑单元 (ALU),在手机上使用时,可提供每秒超过 3 万亿次运算的原始性能。

对于拍照的提升更是巨大,谷歌官方的数据显示,通过PVC,HDR+的运行速度能比在应用处理器 (AP) 上运行快 5 倍,而能耗却不到十分之一。

这块处理器在当时引起了不小的轰动,此前大家的思路都局限在了给手机处理器的ISP做优化上了,如果能用一块算力更强劲,能耗更低的芯片来替代自带的ISP,移动影像的提升还不是手到擒来吗?

这种思路很大程度上影响了国产手机厂商,例如OPPO的马里亚纳X,小米的澎湃C1、vivo的V1……厂商们陆续开启了对自研ISP的探索,谷歌引一时潮流,也在接下来几年时间中多次夺得移动影像比拼的桂冠, Pixel 2 和 Pixel 3 获得了98和 101的DxOMark移动影像分数,且后者在单镜头移动影像中与 iPhone XR 并列第一,证明了自研芯片的可行性。

一机多芯就此成为了谷歌Pixel手机的标志之一,所有人包括手机厂商都在好奇,之前极少参与硬件研发的谷歌,怎么突然拿出了PVC这样的大杀招?难不成是有高人在背后指点?

自研道阻且长

谷歌的Pixel Visual Core并未站在巨人肩膀上,因为它自己就已经是小巨人。

谷歌的自研始于2013年,当时的 Google AI负责人Jeff Dean经过计算后发现,如果有1亿安卓用户每天使用手机语音转文字服务3分钟,其中消耗的算力就是Google所有数据中心总算力的两倍,而全球安卓用户远不止1亿。

数据中心的规模不可能无限制地扩张下去,谷歌也不可能限制用户使用服务的时间,这时候就得寻找另外一条出路,但无论是是CPU还是GPU,都难以满足谷歌的需求:CPU一次只能处理相对来说很少量的任务,GPU在执行单个任务时效率较低,而且所能处理的任务范围更小。

谷歌最终选择了另辟蹊径,并立下了一个不低的目标:针对机器学习这一目的来构建特定领域计算架构(Domain-specific Architecture),还要将深度神经网络推理的总体拥有成本(TCO)降低至原来的十分之一。

2014年,谷歌TPU(Tensor Processing Unit)开始正式研发,得益于谷歌本身既有的强大科研实力,以及从各个公司招募而来的优秀芯片人才,TPU的开发异常顺利,仅在15个月后就开始在数据中心部署应用,且每瓦性能达到了GPU的30倍,CPU的80倍。

谷歌在这件事上表现得还非常低调,直到2016年的Google I/O开发者大会上,首席执行官Sundar Pichai才正式向世界展示了TPU这一自研成果。

Pichai非常自豪地表示,DeepMind研发的AlphaGo能够击败韩国棋手李世石,底层硬件里的TPU功不可没,TPU就像希腊神话中引发特洛伊战争的女人——海伦,它的出现引起了“成千芯片与之竞逐”。

五年后,Sundar Pichai又在2021年Google I/O开发者大会公布了TPU v4:

“AI技术的进步有赖于计算基础设施的支持,而TPU正是Google计算基础设施的重要部分。新一代TPU v4芯片的速度是v3的两倍多。Google用TPU集群构建出Pod超级计算机,单台TPU v4 Pod包含4096块v4芯片,每台Pod的芯片间互连带宽是其他互连技术的10倍,因此,TPU v4 Pod的算力可达1 ExaFLOP,即每秒执行10的18次方浮点运算,相当于1000万台笔记本电脑的总算力。”

时至今日,TPU已经成为谷歌自研技术的代表之一,数以千计的它部署在数据中心当中,执行着数以亿计的AI计算任务。

从某种意义上来说,TPU想要取代的是像英伟达A100和H100这样的加速卡,而针对英特尔应用于服务器的至强CPU,谷歌又自研了另一块芯片——Argos VCU。

2021年3月,谷歌在ASPLOS 会议上首次详细介绍了一块应用于YouTube服务器的自研芯片,即Argos VCU,它的任务很简单,就是对用户上传的视频进行转码。

但也别小瞧了这项任务,用户每分钟会向YouTube上传超过500小时的各种格式的视频内容,而谷歌则需要将这些内容快速转换成多种分辨率(包括144p、240p、360p、480p、720p、1080p、1440p、2160p和4320p)和各种格式(例如,H.264、VP9或AV1),没有一块具备强大的编码能力的芯片,想要快速转码就是一件不可能的事情。

谷歌试过两种第三方解决方案,第一种是英特尔的视觉计算加速器(VCA),包含三个 Xeon E3 CPU,内置 Iris Pro P6300/P580GT4e 集成图形内核和先进的硬件编码器,第二种则是利用英特尔至强处理器外加软件编码来完成任务。

但不论是前者还是后者,都需要庞大的服务器规模和巨额的电力损耗,都是谷歌所不能承受之重。

于是,谷歌在TPU之后,开启了VCU的研发。负责监督 YouTube 庞大基础设施的 Google 工程副总裁斯科特·西尔弗 (Scott Silver) 表示,从2015年开始,大约有 100 名 Google 工程师组成的团队投身设计第一代Argos 芯片,在此后几年当中,这支团队不仅完成了研发,还让芯片应用在谷歌的数据中心当中,而Argos的实力也得以展现——它处理视频的效率比传统服务器高 20 到 33 倍,处理高分辨率 4K 视频的时间由几天缩短为数小时。

而下一代Argos或许早已悄悄在服务器中上线了,根据报道,谷歌自研的第二代VCU将支持 AV1、H.264 和 VP9 编解码器,可以进一步提高其编码技术的效率,也将会是YouTube内容创作生态的最有力支撑。

最让人感到惊讶的是,谷歌对自研芯片有一张非常清晰明确的蓝图,往往是从实际应用的角度出发,针对自身的需求而开发,自研不是目的,而是一种实力允许下的高明手段,利用它来完成别家芯片干不了的事情才是最终目的。

也正是基于这种思路,2017年的Google Cloud Next "17 大会上,谷歌顺势推出了名为Titan的定制安全芯片,它专为硬件级别的云安全而设计,通过为特定硬件建立加密身份,实现更安全的识别和身份验证,从而防范日益猖獗的BIOS攻击。

与前面两块芯片都有所不同,Titan芯片面向的并不全是谷歌自己,它的出现是为了说服企业,数据存在谷歌云中比企业的本地数据中心更安全,

谷歌表示,自研的Titan芯片通过建立强大的基于硬件的系统身份,来验证系统固件和软件组件,保护启动的过程,这一切得益于谷歌自己创建的硬件逻辑,从根本上减少了硬件后门的可能性,基于Titan的生态系统也确保了设施仅使用授权且可验证的代码,最终让谷歌云拥有了比本地数据中心更安全的可靠性。

从TPU到VCU,再到Titan,谷歌逐步构建出了自己未来的护城河,还成功带起了一股大企业自研芯片的风潮,Meta、特斯拉、微软、腾讯、阿里巴巴、字节跳动……无数企业跟随谷歌而扬帆,在芯片之海中竞逐。

而谷歌自研芯片的三板斧,从2013年开始,到2023年,走过了十年的旅程,也恰好是一个懵懵懂懂的学徒,变为授人以渔的师傅的成长过程。

处处不如意的移动芯片

回到Pixel 2系列上的PVC,谷歌能在2017年拿出这样的芯片,实际上已经不会让人感到意外了,毕竟不论是TPU还是VCU,本身就与图像有着千丝万缕的关系,在它们的基础上研发一块专为手机影像而生的芯片,当然能有事半功倍的效果。

但PVC却没能带动Pixel系列的销量,根据彭博社发布的IDC数据,Pixel初代的总销量为330万台,Pixel 2系列总销量为400万台,仅仅增长了70余万台,约等于当年北美市场中三星和苹果高端旗舰销量的零头。

而谷歌却没把销量放在心上,还源源不断地把服务器领域积攒的自研经验转换到智能手机上,2018年10月,Pixel 3系列正式发布,除了继承了Pixel 2的PVC外,它还用上了另一块谷歌自研芯片——Titan M。

没错,前文中提到的Titan芯片在一年后就应用于谷歌最新旗舰之上,这也是自研所带来的优势之一,曾经为企业用户专有的安全芯片,如今散布在每一台手机终端之上。

发布会上,谷歌表示Pixel 3已经成为了迄今为止最安全的手机,原因就来自于它搭载的企业级安全芯片Titan M,在谷歌云数据中心采用的Titan芯片的基础上,谷歌针对移动设备进行了深度的定制,从而保护了用户的安全和隐私。

事实上,Pixel 2系列就已经内置了一个独立于处理器之外的硬件结构,名为Security Modeule的它还拥有了自己的 Flash/RAM/处理单元等组件,而Titan M就是在它的基础上,融入了Titan芯片的成果。

Titan M对智能手机的保护从 Boot 层面开始,与 Verified Boot 进行了深度整合,还可以帮助 Pixel 3/XL 来验证锁屏密码,限制不良程序试图解锁手机的次数,同时也可以保护第三方应用和涉及到安全敏感性的交易,算是安全领域当中不折不扣的多面手。

为了证明Titan M没吹牛,一年后,谷歌直接推出了一项专门的Android安全奖励计划:如果安全研究人员发现并且证明谷歌自研的Titan M安全芯片中存在缺陷,就可以获得最高100万美元的赏金。

有没有人获得这笔赏金还不清楚,但谷歌敢开出100万美元的价码,就足以证明Titan M的可靠性,此后接连数代Pixel手机,都搭载了这一块安全芯片,算是为Pixel用户的隐私安全立下了不小的功劳。

只可惜,不论是PVC还是Titan M,对于Pixel手机的销量都没有太多帮助,Pixel 3系列总销量900万台,其中主要是定位中端的Pixel 3a系列立下的功劳,没有搭载PVC的它反而帮谷歌隐隐摸到了千万销量的门槛。

但之后两代Pixel手机的销量就可以用惨淡来形容了,2019年10月,Pixel 4系列正式发布,把PVC升级到了全新的PNC(Pixel Neural Core),相较于PVC,PNC让手机可以实时预览双重曝光和HDR+,让用户在按下快门之前就看到最终成像,图像计算能力有了进一步的提升,但包括Pixel 4a系列在内,这一代总销量为550万台左右,对比上一代反而大幅倒退

而Pixel 5直接破罐子破摔,原本应是旗舰的它,用的只是高通骁龙765G,不仅没有最新的PNC,也没有PVC,包括Pixe 5a在内,最终销量只有可怜的200万台,比初代的销量还要低,甚至有了谷歌要关停Pixel产线的传言。

这也让大家对手机上的自研芯片产生了怀疑,谷歌在服务器自研芯片上混得风生水起,到了移动市场却是水土不服,幸幸苦苦五六年,加起来还没苹果iPhone单机型一年的销量高,到底是谁出了问题?谷歌or自研?

回头来看,不论是PVC还是PNC,它们本身是作为一种协处理器而存在的,额外的成本注定让它们无缘于中端手机,但销量最高的又恰恰是中低端手机,最大的自研卖点只能留给旗舰,如何做取舍就是一件非常痛苦的事情。

磕磕绊绊的谷歌Pixel,命途多舛的自研芯片,谷歌陷入了漫长的迷茫当中。

谷歌的苹果时刻

消沉之后,谷歌的选择是继续烧钱。

2021年10月,谷歌如期举办Pixel秋季发布会,自研的Tensor芯片瞬间引起了全球的关注,继苹果A系列、三星exynos、华为麒麟之后,又一家手机厂商下场造芯,性能如何,体验怎样,前景又如何,都是大家关心的问题。

虽然谷歌再三强调Tensor的自研属性,但这颗芯片并不是谷歌一手创造。

通过TechInsights的拆解可以看到,Tensor的封装尺寸为 10.38mm x 10.43mm = 108.26mm 2,内部芯片标识为“S5P9845”,符合传统三星Exynos处理器命名规则,如Exynos 990的芯片标识为S5E9830,Exynos 2100 5G SoC芯片标识为S5E9840,这个相似程度,已经不能用三星代工的原因搪塞过去了。

事实上,三星在2020年左右时,正式开放了半定制芯片设计的服务,韩媒ETNews的报道中提到,三星电子将为思科系统和谷歌制造半导体芯片,并负责从设计到生产的整个半导体制造流程,其战略是从设计阶段就提供客户所需的定制技术和功能,而谷歌的Tensor芯片,就是三星半定制设计的最终产物。

具体到硬件上,Tensor和Exynos 2100也是大同小异,只是谷歌在CPU的频率与二级缓存上略有增减,在GPU的规模和频率上更为激进,此外Tensor还集成了谷歌自研的ISP和TPU,外挂了三星的基带,谷歌的自研芯片看上去像是一个完全版的Exynos 2100,即使是去年刚发布的Tensor G2,整体也是在Tensor的基础上修修改改,没有太大的变化。

这时候就有一个问题了,在别人的基础上完成产品设计,到底算不算自研呢?

这个问题如果讨论下去,那真是三天三夜都不会有什么结果的,有人认为,只有全流程的自研才配叫自研芯片,也有人认为,只要根据需求定义了芯片,有创新性的可以叫做自研。

谷歌发布的Tensor明显更接近于后者而非前者,事实上,国内几家手机厂商所谓的自研ISP,大部分也是这种形式,对芯片设计公司提出需求,两家联合定义一块全新的芯片,并买断之后的知识产权,官方的新闻稿里也大多标着自研。

这时候倒也不必对谷歌和国产厂商有多少苛责,因为在手机芯片尤其是SoC上,没有任何厂商能够拍着胸口说自己做到了全流程的自研,大家都要乖乖地从Arm那里购买指令集和新IP的授权。

更何况,这条路上早就有了苹果的脚印。

iPhone 2G、iPod Touch 2、iPhone 3GS和iPod Touch 3上分别搭载的是APL0098、APL0278、APL0298和APL2298这四款SoC,虽然有苹果的丝印,代号也是APL,但设计代工的全是三星操刀,它们真实的代号其实是S5L8900、S5L8720、S5L8920和S5L8922。

2010年1月,苹果推出iPad 1时,里面的芯片不再沿用APL的代号,而是名为苹果A4的崭新自研芯片,但在当时就有人对这块芯片提出了质疑,原因很简单,和同时期的三星S5PC110在硬件架构上过于相像,前者只是在后者的基础上做了一部分调整。

有媒体更是用上了抓眼的标题:苹果 iPad 和三星 Wave (搭载S5PC110的手机)共享大脑。

但今天已经不会有人质疑A4是否真的是苹果自研了,原因不仅是苹果早在2008年就开始了自研的布局,包括收购P.A.Semi和Intrinsity,还有苹果之后性能日益强大,远超同时代芯片性能的A系列芯片,以及2020年末丝毫不逊色于英特尔的M系列芯片。

而用更通俗的话来说,三十年河东,三十年河西,莫欺少年穷,当年的苹果势弱,只能依靠别人的芯片来构筑自己的产品,而在全球畅销亿部iPhone后,苹果也终于得以完成自己理想中的芯片,且是业界首屈一指的自研芯片。

巧的是,不论是谷歌Tensor还是苹果的A4,都和三星有着莫大的关系,从设计到代工,两款相隔十余年的芯片竟也能找到许多相似之处。

今日谷歌Tensor,昔日苹果A4,都是两家公司在自研的路上迈出的艰难一步。

但谷歌的Pixel,远不能与iPhone比拟,而此时前文中的问题的答案终于浮出水面,手机的销量不行,毛病不是出在自研芯片上,而是谷歌对于整个Pixel产品力的把握出了差错。

Pixel初代定位即是影像,Pixel 2加入的PVC就是谷歌为了影像所做的努力,但在之后的三到四年当中,Pixel的影像却仿佛停滞了,与此同时中国手机厂商也开始卷起了影像,逆水行舟,不进则退,谷歌在自研芯片上表现出来的先进,根本无法弥补传感器摄像头硬件上的落后,谷歌本意是对标苹果iPhone,但iPhone此时早已不是拍照方面的标杆。

谷歌在服务器自研芯片上快速迭代,而在Pixel自研芯片上却拖拖拉拉,PVC花了三年迭代到了PNC,Tensor G2性能原地踏步,两相对比之下,实在有些讽刺,背后除了手机部门的本身判断失误外,和谷歌对业务比重的权衡也有莫大的联系。

谷歌正在经历苹果发布A4芯片的那个时刻,但它却没有苹果的魄力,根据The Information的报道,谷歌已将其首款完全定制芯片的发布推迟到2025年,也就是说,谷歌还要接着继续用三星的半定制化设计,也意味着未来两年的Tensor芯片牢牢绑定在了三星工艺之上。

手机市场瞬息万变,两到三年就又是一轮洗牌,谷歌原意是想把Pixel打造成安卓领域当中的iPhone,如今七八年时间过去了还没起色,纵然它财大气粗,真的还能允许手机部门继续在烧钱的路上义无反顾吗?

自研本来是谷歌的底气之所在,如今看来,倒像是成了Pixel手机的最后一块遮羞布。

不难发现,不少国产手机厂商都如谷歌一般,在经历着这样的苹果时刻,倒推一步是技术依赖,前进一步是真正自研,前面是碧海蓝天,后面是万丈悬崖,每一个小小的决定,都会影响到未来五六年的发展。

谁能完成苹果般的转身呢?

关键词: