英伟达,how are you?
12 月 9 日,中国国家市场监管总局发布公告,因涉嫌违反《中华人民共和国反垄断法》,英伟达公司被立案调查。英伟达股价应声下跌。
自从进入所谓 AI 时代开始(其实这个时间点,远远早于 ChatGPT 之类产品的出现,至少再向前推回十多年),英伟达就成了这个时代最重要的科技公司,甚至有人将之比作新科技时代的“石油寡头”。
每一次,无论究竟能听懂多少,但人们都确信,“皮夹克老黄”的每一次演讲和发布,都会给科技行业甚至整个世界带来巨大变化。
厨房GTC,真假黄仁勋丨英伟达
历史上,耳熟能详的大型科技公司实际掌舵者中,杰夫·贝佐斯曾任职亚马逊 CEO 27 年,比尔·盖茨在微软25年,乔布斯在重回之后掌管苹果14年。今年是黄仁勋任职英伟达CEO的第31年,而他也是科技公司现任CEO中时间最长的一位。
英伟达与黄仁勋已经深深绑定,某种程度上可以说,英伟达公司的历程就是黄仁勋个人特质的清晰体现——是精通技术的远见者,也是务实敏锐的商人。
过往三十年,黄仁勋几乎踩中了每一个技术兴奋点,带领英伟达从一众显卡商中厮杀出来,成功转型成人工智能公司,登顶全球市值最高。
所以,想了解今天科技世界,总绕不开一个问题:英伟达,怎么是你?
“NVIDIA”这个名字怎么来的?
一切始于太阳微系统公司内部的一个秘密项目。普里姆和马拉科夫斯基在罗辛(曾在苹果开发“lisa”,因此认识到高效的图形处理的重要性)要求下,秘密开发专用的图形加速芯片,后来叫 GX 图形引擎。彼时,生产专用集成电路的公司 LSI 刚推出一种新型芯片架构,为了得到太阳微系统公司的制造订单,派员工黄仁勋来协助处理制造上的问题。
普里姆在英伟达办公室打游戏丨cruciblemoments
后来,普里姆又开发出一款飞行模拟游戏《飞行员》来展示“GX 图形引擎”的性能,并在 1991 年的 SIGGRAPH(SIGGRAPH 承载了英伟达创办历程中的很多高光时刻)年度大会上展出,一举成功。GX 的成功和逐渐暴露的“大公司病”推动普里姆和马拉科夫斯基自立门户创建显卡公司,黄在斟酌了个人电脑和电子游戏的未来市场是否足够有前景后,接受了加入公司的邀请。加入公司那天,黄正好30岁。
三个人在Denny’s餐厅决定创办英伟达丨cruciblemoments
给公司取名时,列表上最后剩下的一个选项是“Invidia”,这是普里姆(CTO)通过查找拉丁文“嫉妒”一词找到的,他们相信竞争对手,包括太阳微系统公司都嫉妒他们的成功。“我们去掉了 I,选择了 Nvidia,以纪念我们正在开发的 NV1 芯片。”NV 代表 Next Version,受到 Windows NT得启发,NT 代表 New Technology。
但是,英伟达在1996年差点破产了
第一款芯片 NV1 没有做好 VGA 兼容,导致在基于 DOS 的游戏例如《毁灭战士》上运行不佳。最初,一款“杀手级游戏”最初就能决定一家图形显卡公司的“生死”。另一个图形公司,3dfx 因为将 3D 实时渲染功能很好地适配了《雷神之锤》, Voodoo 系列显卡卖疯了。
而 NV1 的失败直接危及了英伟达与世嘉的关系,世嘉终止了英伟达为其下一代游戏主机开发 NV2 的合同。
在濒临破产的生死线上,黄做了一个决定,还是以牺牲三个月公司资金链的代价购买了一台芯片仿真器用来测试数字芯片原型,而不必等真的制造出来一颗再去测试,因为留给 NV3 的时间实在不多了。NV3 后来改名为 RIVA128,RIVA 代表实时交互视频和动画加速器,128 是指 128 位总线,单一芯片上所能使用的最大宽度的总线,首次被应用在消费级个人电脑中。第一次公开展示时,一名 3dfx 员工来跑来揶揄,“哟,你们还在啊?”
后来,英伟达也“报复”回去了。它在一条通往 3dfx 总部的高速公路的立交桥上设立了一个广告横幅,以宣传 GeForce 256。该横幅宣称,英伟达的 GPU 将改变世界并击垮竞争对手。州警迅速移除了这个非法设立的横幅,英伟达也因此收到了正式警告。
NV1 和 NV2 的失败让 3dfx 都相信英伟达的破产不可避免了。他们想收购英伟达,但决定再等一等,想“抄个底”。没成想,英伟达靠 RIVA128 成功挺了过来。3dfx 没等到英伟达破产,却在 2000 年,被英伟达收购了知识产权,继承了它的图形资产。
如果,不是黄仁勋呢?
因为 NV1 没有做好 VGA 兼容,导致失去了大量游戏玩家。但在开发 RIVA 128 时,黄不仅从英伟达的竞争对手 Weitek 公司获取了 VGA 内核的设计许可,还挖来了 VGA 芯片设计师,后来成为黄的得力助手。普里姆评价黄是世界上最好的交易谈判者。
1994年黄仁勋坐在英伟达第一间正式的办公室里丨cruciblemoments
虽然世嘉终止了 NV2 的合同。但多亏了黄仁勋在最初合同中添加的一个条款,如果英伟达能够生产出可用的芯片原型,并能安装在与早期主机尺寸相仿的独立主板上,世嘉将支付 100 万美元。因此,即便英伟达拿不到下一代主机的芯片订单,还是通过开发出 NV2 原型拿到了 100 万美元,挺了过来,并将其中大部分资金用于 NV3 的研发。
英伟达第二次进入游戏主机市场的契机,是得知微软正在开发其第一款主机,该主机基于 DirectX 应用程序接口构建。每次微软更新 DirectX 时,英伟达的显卡都会如期出现在微软总部。送卡甚至不需要在英伟达内部做自愿申请。因为黄的原则很直接,谁能跑得更快,谁就能占领更多的市场。最终,英伟达顶替了 Xbox 的意向合作方 Gigapixel。直到今天,其 CEO 哈伯还会愤愤不平,“不然,今天经营一家市值万亿美元公司的人是我,而不是黄仁勋。”
就爱送卡,把第一台DGX-1送给OpenAI丨Elon Musk on X / Twitter
黄有一个”运送一整头牛”的策略,指在高端产线中构建低良率部分,并在整个系列中创建四五种不同的产品。这在和苹果公司合作中起了很大作用。
英伟达因为想制作皮克斯《小台灯》动画来展示新芯片的图形渲染能力,找到乔布斯。乔布斯看到与皮克斯用超级计算机花费几周生成的视觉清晰度相当的视频,当即决定在 Power Mac G4 电脑上提供 GeForce3 作为高端选项。
临走前,乔布斯提醒英伟达小心 ATI 在笔记本电脑芯片领域的动作。英伟达告诉乔布斯,只要将英伟达芯片的时钟频率降低,就能与 ATI 芯片的频率相当,但整体性能却好于 ATI 的。那次交流后,英伟达在苹果笔记本电脑上的份额,从零增长到占据苹果整个计算机产品线的 85%。
“他总能为英伟达达成惊人的商业交易,一次次的拯救公司。”普里姆说。
“GPU”这一概念从何而来?
1999年,黄仁勋发布 GeForce256 时,他毫不避讳地“夸大其词”,“我们正在推出世界上第一款 GPU。”过去,英伟达通常将“首字母缩略词+数字”作为芯片典型命名公式,但这种展示技术领先性的命名方式向客户推介起来愈发有难度。
GeForce 256丨cruciblemoments
于是内部决定开创一个全新的产品类别——图形处理器(GPU),表示它在图形渲染方面的作用就像计算机的 CPU 在所有其他计算任务中的作用一样。并且决定不注册“GPU”商标,因为希望其他公司也可以使用这个术语。
黄仁勋和马斯克,谁更卷?
黄 15 岁在餐厅打工,即便是第 100 次打扫同一间厕所,也会以最高标准要求自己。但他也学会了另一个“职场技巧”,在高标准和高效率之间取得平衡,这一点表现在如果有人点奶昔,他会因为制作和清理奶昔要花更多时间,试图说服客户将奶昔换成可乐。
包括英伟达在内的芯片制造商,通常需要 18 个月从设计到推出一款新芯片,且每次只能专注于一款芯片。电脑厂商的产品更新周期是 6 个月一次,分别在春季和秋季(返校季)。如果生产出的芯片满足不了当下电脑厂商对最新配置的要求,就会被淘汰。
于是,黄重组了设计团队。当一组设计新的芯片架构时,另外两组配合开发基于新芯片的迭代版本。另外将 RIVA128 的成功经验(通过仿真极致压缩设计周期)复用,形成常态。从而将发布周期缩短至 6 个月,从而匹配个人电脑制造商的采购周期。
偶尔也不穿皮衣,老黄在中国区年会上丨英伟达
物理学上没有比光更快的概念,但“光速”已经满足不了黄的做事态度。有一次他对员工说,“我们得像孢子驱动(能让宇宙飞船瞬间移动到另外地方)那样!”,引得大家哈哈大笑。因为黄是《星际迷航》的狂热爱好者。
英伟达为什么能一直保持技术领先,
并从图形公司转型到人工智能公司?
2006 年,英伟达成立了一个研究部门,专注英伟达常规业务中不会出现的创新,只有通过专注的、长期的工作才能实现的创新。
2008 年,这个团队在 SIGGRAPH 上展示了“用 GPU 进行光线追踪的效果”,英特尔员工一边看一边在手机上疯狂打字。此后,英特尔的研究团队再也没有发表关于在 CPU 上进行光线追踪的论文。
2018 年,SIGGRAPH 上,黄介绍了图灵架构(对,就是向图灵致敬)及其专用光线追踪处理器内核,并在一周后科隆游戏展上在 GeForce RTX 20 系列显卡中推出。
2012年,Hinton 带着他的两名学生参加了李飞飞举办的 ImageNext 视觉识别比赛。他们训练了一个深度学习神经网络 AlexNet,识别准确率比其他团队高 10 个百分点。Hinton 等人使用的就是英伟达的 GPU,这让黄看到了巨大的机会——深度学习将成为 GPU 的下一个“杀手级应用”。
说Ilya Sutskever(左)、Alex Krizhevsky(中)、Geoffrey Hinton(右)丨多伦多大学
2017 年谷歌发表 Attention Is All You Need 那篇论文后,黄立刻指示 GPU 软件团队为 Tensor Core 编写一个专门的库,以优化 Tensor Core 在 Transformer 上的使用,首先被内置于 Hopper 芯片架构中。Hopper 架构在 2010 年代末开始开发,在 2022 年发布,比 ChatGPT 发布早一个月。于是在 2023 年生成式人工智能的需求激增时,英伟达是唯一一家准备好全面支持这一浪潮的硬件制造商。
英伟达看到的下一个机会是什么?
“毫无疑问,数字生物学将是下一个方向。”2023 年,黄接受采访时说。
而在此前,英伟达 GPU 和 CUDA 平台已经在高校,科研专家,顶尖开发者圈子里“流行”开来。Generate:Biomedicines(一家蛋白质药物生成研发公司)的 CTO 格里戈良发现,自 21 世纪初以来,许多开展分子动力学模拟的科学家在购买英伟达的游戏系列 GPU,并用它们执行非图形计算。他日常使用 PyTorch(开源机器学习库),而 PyTorch 与 CUDA 配合良好,“我根本不用考虑选择哪种类型的 GPU。”
简而言之,CUDA 是一种给工程师在成百上千计算单元上执行并行计算的架构。早期,英伟达为了让所有 GPU 都兼容 CUDA 投入了大量资源,毛利率从 2008 财年的 45.6% 下降到 2010 财年的 35.4%。英伟达在高校教授并行计算和 CUDA 编程课,吸引人才来用。在科研圈赠送 GPU,希望以此看到更多 GPU 的应用案例。加州大学圣地亚哥分校的生物学教授说,“我们可以告诉英伟达’我们需要这个功能’,然后他们会改变芯片的设计或将其添加到 CUDA 中,英特尔是永远不会这样做的。”
什么样的人才可以进入英伟达?
2005 年,一家名为 3Dlabs 的公司的图形芯片工程师部门被解散。英特尔准备招聘这些员工,但要求他们搬离原处,享茨维尔。黄仁勋得知英特尔的动作后,迅速派遣高管招募 3Dlabs 团队,而且没有提出搬迁要求。他示意高管在原处开设一个新的办公室,供 3Dlabs 团队成员使用。英伟达至今仍在使用位于享茨维尔的办公室。
英伟达不会不断解雇和招聘新员工,而是充分利用现有员工。黄将员工按职能,而不是业务单元或部门划分,以便具备合适技能的人不断被分配到新的项目中。
黄曾经为了挖角硅图公司的首席工程师,要求团队用最新芯片开发一个图形功能,实现类似该工程师在硅图开发的某个功能效果。而这是为了告诉他,硅图用高性能工作站才能实现的功能将集成到英伟达为个人电脑所用的单颗芯片中。
黄仁勋在小便池旁遇到员工会打招呼吗?
会。
一名技术营销工程师讲述,他曾在卫生间里遇到黄,被黄随口问道最近的工作。他本想敷衍一下过去,但直到在黄的追问下把手头上的20件工作都罗列出来,才让黄满意离开。
所以在英伟达,员工很难把自己隐藏起来。黄曾在欢迎会上对一名员工打招呼,“你是某某某,之前在索尼 Play Station 工作,再之前在 3dfx。”新员工通常很吃惊,但老员工却习以为常,“这很正常,他对每个人都这样。”
黄要求员工向直属上级发送电子邮件汇报工作,详细说明他们正在做的五大事项,以及对于市场的观察。因为黄回复速度极快,员工们一般不敢在周五晚上发邮件。摸清了这个规律后,通常,黄在周日晚上坐在家里的办公室,手里拿着威士忌,处理邮件。“他想了解世界上正在发生的事情,这样他就能做出更好的决策。”
黄还致力于实现《星际迷航》中瓦肯人的心灵融合——让员工的思维与他自己的思维完全融合。他最喜欢将思考过程呈现出来的方式是写在白板上,一种稍显弱后的媒介。而当所有人完成展示后,无论想法多么精彩,都必须擦掉,然后重新开始。因为英伟达文化不鼓励回顾过去,黄仁勋本人也是。
摘自|《英伟达之道》
出版|中信出版社
作者|[美]金泰(Tae Kim)
编辑:沈知涵
摘编来源:《英伟达之道》
封面图来源:Quartr
本文来自果壳,未经授权不得转载.
如有需要请联系sns@guokr.com