1、英伟达的创新与生态刘致雅英伟达中国区高级市场总监刘念。宁英伟达率先意识到,深度学习是一个潜在的大市场“摩尔定律已经死了。”英伟达(NVIDIA)CEO 黄仁勋在 2019 年末下了这样的定论。摩尔定律是所有计算机人都耳熟能详的词。这个词指的是 1965 年英特尔联合创始人戈登摩尔(Gordon Moore)提出的一个想法,即集成电路上可容纳的元器件的数量每隔 18 至 24 个月就会增加一倍,性能也将提升一倍。半个世纪以来,这条定律都非常准确地预测了半导体行业的发展趋势,成为计算机处理器制造的准则,也成为推动科技行业发展的“自我实现”预言。那么以游戏芯片起家的英伟达为何会得出这样的结论?这岂不
2、是“打脸”?他们会如何应对“摩尔定律已经结束”的未来?“英伟达很早就认识到这个世界在不断变化。”英伟达中国区高级市场总监刘念宁在接受创业采访时强调,“所以创新被看作是第一原则,创新的核心则是创造出让客户满意且能提高行业标准的产品。”从 1999 年在纳斯达克上市,发行市值不过 2.3 亿美元;到 2020 年最新市值高达1780 多亿美元,英伟达对“创新”这一概念有着当之无愧的发言权。创新被看作是“第一原则”,创新的核心则是创造出让客户满意且能提高行业标准的产品。从 GPU 到 HPC 再到“HPC+AI”1993 年,英伟达成立。创始人是从 LSI Logic 走出的黄仁勋及来自 SunMi
3、crosystem 的两位工程师 Chris Malachowsky 和 Curtis Priem。黄仁勋看准了图形显示芯片赛道,并坚信终有一天 PC 会成为享受游戏和多媒体的消费级设备(在当时 PC 主要作为生产力设备而非消费级设备),这也是英伟达诞生的初衷。尽管其 RIVA 处理器系列一经推出就成了行业“爆款”,彼时的英伟达还是一家“小公司”,直到 1999 年上市,发行市值也不过 2.3 亿美元左右。1999 年对于英伟达来说是具有里程碑意义的一年。同年,英伟达推出 GeForce256世界上第一款功能齐全,可从真正意义上替代 CPU 渲染的图形处理单元(GPU)就此诞生。GPU 也就是
4、 Graphic Processing Unit(图形处理器),和 CPU 相比,更擅长进行大规模并行数据处理。GPU 诞生后,整个芯片世界也同时进入了一波新的飞腾时期。但是和英特尔、AMD 不同的是,英伟达一心专注在 GPU 领域,将几乎全部的研发费用都投入在了 GPU 上,不断打磨技术,构建核心能力它坚信,未来属于 GPU。虽然 GPU 是为了图像处理而生,但 GPU 不仅可以在图像处理领域大显身手,还可以被用在科学计算、密码破解、数值分析、海量数据处理(排序、Map-Reduce 等)、金融分析等需要大规模并行计算的领域。因此,GPU 也可以认为是一种较通用的芯片。2007 年,英伟达收
5、入超过 40 亿美元,相比上市时增长了近 5 倍。随着 PC 市场增长趋缓,显卡市场的增量红利消失,竞争对手对存量市场的争夺开始趋于白热化。2008 年,AMD 公司收购显卡二当家 ATI 公司,试图用 CPU 整合 GPU,而 Intel 也开始倒向 ATI,并在自己的芯片组中集成了 3D 图形加速器。CPU 向 GPU 宣战。此时,受到 2008 年金融危机影响的英伟达也出现了亏损。当英伟达发现传统业务注定只能在存量市场中博弈时,它毅然进行业务转型创建出 CUDA 编程模型和 Tesla GPU 平台,将并行处理引入通用计算领域,一种全新的强大的高性能计算方式(HPC,High-perfo
6、rmance Computing)由此诞生。英伟达的核心价值观第一条就是创新。而创新的第一原则就是做出让客户满意、并且能够提高行业标准的产品。在此之前,HPC 领域虽被行业看好,但并没有明显胜出的“赢家”。在 NVIDIA推出 CUDA 之后,江湖格局已定:CUDA 使用 C 语言扩展并行编程,通过共享存储器来通信,两个层次的并行方式都简化了编程,这使得本科生也能够使用CUDA 来写大规模高性能计算程序;竞争对手 AMD 的 brook+一下子就黯然失色。此后,英伟达聚焦高端游戏市场,并同步发展 GPU 通用计算。智能手机出现后,笔记本电脑、平板等多元化应用分散了 PC 的需求,PC 及 PC
7、 独立显卡出货量均开始呈下滑趋势。但是英伟达此时已经成功地将战略中心转移至高端游戏卡市场,加快 GPU 架构的迭代速度,实现与 PC 市场成功解绑。在 HPC 领域的深耕使得英伟达在下一波浪潮来临时做好了充足准备2012年,深度学习之父 Hinton 采用 GPU 解决方案去参加了大规模视觉识别挑战赛(ILSVRC)而一举夺冠。AI 时代到来,人类社会进入到新纪元。英伟达率先意识到,深度学习是一个潜在的大市场。在当时,其竞争对手几无察觉。深度学习大火后,英伟达为互联网大公司提供 GPU 用于深度学习训练,在这一领域基本上占据了绝对优势,并且为英伟达贡献了大量收入和近十倍的市值提升。2015 年
8、,公司营业收入增长至 50 亿美元左右,总市值突破 150 亿美元,实现对 AMD 的反超。与此同时,用于运算的 Tesla 显卡也随着 GPU 架构的升级得到不断更新,为后期数据中心业务发力做出了充足的储备。如今,英偉达已经在人工智能训练芯片市场确立了垄断性地位,市值达千亿美元。这既是时代的机遇,也是专注的结果。超级计算的适用范围正在迅速扩展,从最尖端的物理、医学研究,到当前最热门的人工智能和自动驾驶研发,时代再次证明了英伟达的眼光以 CPU 为中心的单块式超级计算机时代即将结束。新的时代已经到来。“创新”第一原则:提高行业标准看起来,英伟达是被 AI 的“馅饼”砸中。实际上,机遇往往是为做
9、好准备的人提供。“英伟达的核心价值观第一条就是创新。”刘念宁告诉创业邦,“而创新的第一原则就是做出让客户满意、并且能够提高行业标准的产品。”就像大家很容易遗忘在 iPhone 发布前,苹果已经在电脑上做了十几年操作系统一样,AI 芯片公司们也在忘记英伟达是一家显卡供应商的同时,它还一直在不断打磨另一个杀器CUDA。其实,在 CUDA 推出后的一段时间内,英伟达的 HPC 业务收入相比其他业务还是小头,给英伟达带来的利润也不高,但是英伟达还是坚持为 GPU 计算开发了一代“热卡”Fermi,Fermi 能进一步降低 CUDA 编程的难度。在每年的 NVIDIA GTC 会议上,黄仁勋还会花大量的
10、时间介绍 GPU 计算,出了什么新卡和新库,CUDA 新版本有那些特性,等等,让参会者时常忘记这是一家以显卡为主营业务的公司。“正是因为基于这样的第一原则,我们才能在其他人都还没觉察到他需要什么的时候,就带给他新事物。”刘念宁说。那么如何为消费者带来新的产品和新的体验?刘念宁告诉创业邦,英伟达把创新分成了四个方面:第一,梦想要大(dream big);第二,从小做起(startsmall);第三,敢于冒险(take risk);第四,快速学习(quicklearning)。体现在从 GPU 到 HPC 的转型上,就是一方面把 GPU 通用化让一块只能渲染图形的独立显卡,变成一个通用计算图形处理
11、器(GPGPU);另一方面让英伟达现有与即将推出的所有 GPU 都必须支持 CUDA 程序。“这就是为什么在游戏业务蓬勃发展的同时,英伟达能很早就开始颇具先见性地着手将 GPU 用于通用计算的问题;在 AI 时代到来之前,英伟达也很早就在使用深度学习教 AI 观察及识别图像和声音,了解它们的状态,并推断接下来会出现什么。”刘念宁说。例如,英伟达是少数建立了 VR 生态的公司之一,并通过 HolodeckVR 平台助力3D 模型的协同开发。和 PC 游戏类似,性能对于 VR 设备至关重要。VR 设备的高性能需求将使得英伟达产品进一步高端化。公司计划将 GeForce GTX 1060 或者更高端
12、的 GPU 用于具备 VR 功能的台式机或者笔记本电脑。高性能硬件将大幅降低总体拥有成本,创造长期商业机会。打造安全的自动驾驶汽车,也许是当今社会所面临的最大计算挑战。实现自动驾驶汽车所需的投入呈指数级增长,面对复杂的开发任务,则需要像 Orin 这样的可扩展、可编程、软件定义的 AI平台。如今,不管是在自动驾驶,医疗健康,还是大数据领域等,都能看到英伟达进行创新的原则围绕并行处理技术方面的基本优势,在不同的领域中找寻突破和延伸。以自动驾驶为例。2019 年 12 月,英伟达发布了最新的自动驾驶芯片 Orin,该芯片由 170 亿个晶体管组成,由英伟达团队耗时四年打造。Orin SoC 集成了
13、英伟达新一代 GPU 架构和 Arm Hercules CPU 内核以及全新深度学习和计算机视觉加速器,每秒可运行 200 万亿次计算,几乎是英伟达上一代 Xavier 芯片性能的 7 倍。正如黄仁勋在苏州 GTC China 大会上所表示的:“打造安全的自动驾驶汽车,也许是当今社会所面临的最大计算挑战。实现自动驾驶汽车所需的投入呈指数级增长,面对复杂的开发任务,则需要像 Orin 这样的可扩展、可编程、软件定义的 AI 平台。”回顾英伟达发展历程,刘念宁认为,从 PC 图形芯片到游戏显卡,从 GPU 到HPC 再一路到 AI,英伟达能从一家传统的显卡供应商转变为人工智能服务器供应商,推动它不
14、断前进的,正是“创新”。一砖一瓦搭建生态2020 年,美国财经网站 Market Watch 曾用“华尔街为之震惊”,来形容英伟达财报的强势表现游戏板块保持强劲、云计算应用稳中有涨、无人驾驶、专业视觉化、OEM&IP 前景可期。未来,英伟达的野心在哪里?刘念宁根据自己的市场观察,认为答案将落在“生态”上。其实,自从推出 CUDA 以来,如何建立生态,吸引开发者使用 CUDA 就是英伟达一直在思考的事,随后,英伟达推出了一系列的措施来建立生态。“当我们看到一个新兴市场的潜力时,会基于我们现有的技术优势,找到合适的细分角度再去切入。”刘念宁说,“这时候,需要开发者和初创企业为我们(英伟达)赋能,一
15、个开放式的生态平台必不可缺。”随着自然语言理解取得最新突破,AI 可以学习人类知识的代码,计算机也可以进行自然对话、进行阅读和总结,并更自然地与人类协作。从运输到医疗保健,从金融服务到零售,各个行业都在竞相利用 AI 的自动化功能,这也意味着可应用的场景将更加垂直化和碎片化。如何进入到这些新场景中?英伟达一方面对数据库进行开源,如支持常见并行原语的 CUDA,支持多 GPU 之间通信的 NCCL,英伟达优化的 nvcaffe 等,这些库降低了各个领域使用英伟达 GPU 开发应用的难度。但另一方面,英伟达并没有贸然推出新品,而是通过优化软件性能的基础库给厂商赋能,通过这种“多交朋友”的方式,英伟
16、达扩大了生态触角,又避免了自己去做的潜在失败可能。例如,过去数十年来,汽车行业的研究和开发投入都集中在引擎设计和材料加工上。可现在,更多汽车生产商打算把资金投入到由软件定义的未来自动驾驶技术上。英伟达在此基础上和丰田进行了合作开发、训练和验证,并将架构扩展至新一代自动驾驶汽车的完整产品线上。2016 年,英伟达发起了名为“英伟达初创加速计划 NVIDIA InceptionProgram”的开放式创新计划,目前已經与 5000 多家各个垂直领域的 AI 初创公司合作,作为一个免费会员制的创业孵化器,英伟达初创加速计划 NVIDIAInception Program 依托英伟达在业界领先的 AI
17、 技术,以技术为驱动,为会员提供全方位的免费服务,支持使用深度学习,机器学习以及数据科学技术的初创公司。通过初创加速计划,能够迅速了解世界上最领先的创业公司在做什么,并且在适当的时机还可以通过投资等手段把这些创业公司吸引到自己的生态中。其中,在刘念宁主导的中国市场中已有 600 多家合作伙伴,分布在全国 30 多个城市以及 30 多个不同的行业。如果成为初创加速计划 Inception Program 的成员,就可以较早应用 NVIDIA 的技術并参与协助 NVIDIA 一些新产品线的研发,例如图森未来、速腾聚创等一批国内自动驾驶技术公司就是初创加速计划Inception Program 的成
18、员。“对于英伟达来说,通过初创加速计划,能够迅速了解世界上最领先的创业公司在做什么,并且在适当的时机还可以通过投资等手段把这些创业公司吸引到自己的生态中。”刘念宁说。以图森未来为例。这是国内最早研发可商用的 L4 级(SAE 标准)自动驾驶卡车解决方案的公司之一,总部设在北京和美国圣迭戈。图森未来先通过初创加速计划 Inception Program 获得了英伟达的注意,随后又在进行 B 轮融资时获得了英伟达 GPU Venture Program 的投资。作为上市公司,往往面对“创新”时会优先考虑哪个项目更容易尽快实现收入和盈利,从而可以继续做大上市公司市值。那么对于项目培养周期长、投资金额
19、大、回报周期长的项目,就会被上市公司放在次重要位置,甚至被搁置、抛弃。可是很多伟大的技术突破性产品,需要公司用很长的时间投入巨资耐心培育,这就导致大公司陷入了“创新者的窘境”。“英伟达突破大公司窘境的方法是建设生态,我们为初创公司和开发者提供他们需要的产品和技术。”刘念宁说,“这样一来可以为初创公司赋能;二来可以加速英伟达的开发速度。”以人为本,不断重塑自我今年以来,突如而来的疫情席卷全球。在经济萧条的大环境下,该如何坚守初心,积极创新?黄仁勋不久前给所有员工写了一封公开信,信里体现了这家大公司“以人为本”的理念。信里首先提及,英伟达不仅不会裁员,还会“争取给大家多发一些钱”。而公司在图形、科
20、学、人工智能和机器人领域所做的工作对未来比以往任何时候都更加重要。“人们对机器人技术的兴趣正在高涨,从自动零售结账和仓库机器人到自动移动消毒机器人,把造成工人感到不安全的任务自动化。在医疗保健领域,诊断仪器和科学计算的需求量很大,因为医疗行业正在寻找遏制和减轻这种病毒影响的方法。”除此之外,英伟达也在用自己的技术和专业技能加速疫苗的研发。“我们组建了一支由英伟达人工智能和高性能计算机专家组成的团队,加入了 COVID-19 高性能计算机联盟大部分计算能力是 NVIDIA GPU 加速的。我们在充分利用这些系统方面拥有丰富的专业知识,协助加速疫苗的研发。”信的最后,黄仁勋还为世界各地居家办公的员
21、工打气:“我最喜欢的是,我们的一位员工在这一切之中生了一个漂亮的女婴。她正在享受育婴假福利。我提醒她,我们都正在享受同样的居家福利。虽然没有忙着换尿布,但许多同仁正在重新温习几何和三角。说不定还有些人很乐意和这个新手父母交换位置呢!”在这个特殊的时期,英伟达初创加速计划 NVIDIA Inception Program 还依托公司的生态资源推出了一系列的活动支持会员公司,如通过英伟达深度学习学院 NVIDIA DEEP LEARNING INSTITUTE(DLI)在线课程可以免费学习通用基础、数字内容、医疗、智能视频分析、IT 等众多领域课程,并在学习完成后获得英伟达深度学习学院(DLI)的课程认证证书。再比如,初创加速计划 Inception Program 的会员也可以享受 GPU 云资源优惠,这些云资源包括 AWS、Microsoft Azure、滴滴云、阿里云等。如果问,天下是否有免费的午餐?那么在摩尔时代,摩尔定律就是免费午餐;在AI 时代,算力就是免费的午餐。英伟达知道自己的优势所在,英伟达还将把自己的优势在各行各业发挥出来。27 岁的英伟达意气风发,如同一台“学习机器”,不断重塑自我。