就在“蜂鸟”项目组为了早日拿下诺基亚订单而奋力冲刺、整个公司的主流资源都向功能手机Soc倾斜之际,在启明芯内部,一个更加神秘、也更具长远战略意义的项目,代号“夸父”(Kuafu),也悄然完成了前期的准备工作,正式进入了实质性的预研阶段。
“夸父”,取自中国上古神话中那位追逐太阳的巨人,寓意着这个项目所承载的宏伟目标和不畏艰难的探索精神。它的核心任务,是为启明芯在未来十年甚至更长的时间里,储备下足以支撑公司在高性能计算领域(包括但不限于移动端、服务器、乃至人工智能)立足的核心竞争力——自主可控的高性能cpU和GpU架构。
这个项目的保密级别被定为公司最高。除了林轩、赵晴鸢以及项目直接负责人王志刚(前Intel高级cpU架构师)和约翰·卡特(前图芯cto,负责GpU架构)等极少数核心高管和技术领袖外,公司内部几乎无人知晓其具体内容和目标。甚至连项目的预算,都是从林轩亲自掌握的、未列入常规财报的“战略储备基金”中单独划拨,以确保其独立性和隐蔽性。
项目启动的“仪式”,也极其低调。没有隆重的会议,没有公开的任命。时间大约在2002年末,地点就在香港总部大楼里一间经过特殊改造、拥有独立门禁和物理隔离网络的“未来技术实验室”(Future tech Lab, FtL)内。
实验室面积不大,只有百十来平米,里面的陈设也极其简单,除了几排高性能工作站、一台小型服务器集群、以及一些基础的测量仪器外,最显眼的就是墙上挂着的几块巨大的白板,上面已经写满了各种复杂的公式、架构图和性能分析曲线。
这一天,实验室里只有四个人:林轩、王志刚、约翰·卡特,以及一位新加入的、同样是林轩利用“行业寒冬”从硅谷某顶级图形公司挖来的、在并行计算和编译器领域有着深厚造诣的华人科学家,名叫周明远(Zhou mingyuan,虚构)。他将作为“夸父”项目编译器和软件工具链方向的负责人。
“王工,卡特先生,周教授,”林轩看着眼前这三位堪称世界级的技术大牛,他们将构成“夸父”项目最初的“铁三角”核心,“今天把大家召集到这里,算是我们‘夸父’项目的一个非正式的启动会。”
“我知道,外界包括我们公司内部,可能都认为启明芯的未来在于移动通信,在于‘蜂鸟’能否成功。这没有错,‘蜂鸟’是我们未来三到五年内最重要的增长引擎和现金牛来源。”林轩的语气平静却带着不容置疑的力量,“但是,我的目光,看得更远。”
“移动通信的浪潮终将过去,或者说,它将演变成一个更加广阔的、万物互联、数据驱动的智能时代。而在那个时代,真正决定一个国家、一个公司核心竞争力的,将不再仅仅是连接能力,而是计算能力!是对海量数据进行高效处理、分析和决策的能力!”
“cpU和GpU,就是现代计算体系的两大基石。谁掌握了最先进的cpU和GpU架构,谁就掌握了未来信息产业的制高点!”林轩的眼中闪烁着对未来的洞察,“Intel凭借x86统治了pc和服务器市场数十年;Nvidia正在GpU领域开创新的计算范式……我们启明芯,绝不能在未来的核心计算战场上缺席!我们不仅要参与,更要力争成为领导者!”
“这就是‘夸父’项目存在的意义!”他加重了语气,“它承载的,是启明芯未来十年、二十年的技术梦想!是我们在高性能计算领域‘逐日’的雄心!”
王志刚,这位曾经在Intel参与过多款奔腾处理器核心设计的资深架构师,此刻的心情是激动的。离开Intel加入启明芯,他看中的不仅仅是优厚的待遇,更是林轩描绘的这个“从零开始构建世界一流cpU”的梦想。在Intel,他或许能继续按部就班地优化现有架构,但在启明芯,他有机会去创造一个全新的可能。
“林总,我明白您的决心。”王志刚沉声说道,“我和我的小团队(目前只有他和另外两名从Intel\/Amd挖来的资深架构师)已经对当前主流的cpU架构(x86, ARm, mIpS, powerpc)进行了深入的分析和评估。考虑到生态系统的成熟度和未来的发展趋势,我们建议‘夸父’cpU项目选择兼容ARmv7\/v8指令集架构(获取架构授权,而非购买现成内核Ip)作为起点。”
“选择ARm,不是因为我们想做简单的‘替代’,而是因为ARm指令集在低功耗和移动生态方面拥有巨大优势,这是我们无法忽视的。但是,”王志刚眼中闪过一丝锐气,“我们绝不会满足于购买ARm的公版内核!我们的目标,是基于ARm指令集,开发出属于启明芯自己的、拥有完全自主知识产权的、在性能(特别是单核性能和能效比)上能够超越ARm公版甚至挑战Intel同级别产品的高性能微架构!”
林轩点了点头,表示赞同:“英雄所见略同。ARm生态是未来移动和嵌入式领域的主流,我们必须拥抱它。但核心竞争力在于微架构的自主创新!王工,你对我们第一代自研ARm微架构,有什么初步的设想?”
王志刚走到白板前,拿起笔,迅速勾勒出一个简化的处理器流水线框图:“我的初步想法是,第一代核心(内部代号可以叫‘苍穹’ - cangqiong),至少要做到乱序执行(out-of-order Execution),拥有比较深的流水线(10级以上),配备足够大的指令窗口和重排序缓冲(Rob),采用先进的分支预测技术,并集成高效的L1\/L2缓存子系统。目标是在同等工艺和频率下,实现比当时ARm最高端的公版内核(如cortex-A8\/A9)显着更高的Ipc(每时钟周期指令数)。”
“这是一个极具挑战性的目标。”林轩评价道,“但方向是对的。我们需要一开始就瞄准高性能,而不是满足于做一个简单的低功耗核心。”
接着,他转向约翰·卡特:“John,GpU这边,‘灵猴’Gen 1主要是为了满足功能机和早期智能手机的需求。但‘夸父’项目的目标显然不止于此。你对我们未来的高性能GpU架构,有什么规划?”
卡特,这位对图形技术充满热情的艺术家型工程师,眼中也闪烁着光芒:“Lin,自从上次我们确定了‘平台化、可扩展’的思路后,我和团队(主要是他和另外几位图芯老将)一直在思考如何构建一个真正面向未来的统一计算架构(Unified puting Architecture)。”
“传统的GpU主要面向图形渲染,计算能力是固定的、专用的。但我认为,未来的趋势一定是通用计算(GpGpU)!GpU将不仅仅用于画图,更将成为处理大规模并行计算任务(如科学计算、物理模拟、甚至未来的人工智能)的主力!”卡特激动地比划着,“我们需要设计一种全新的、基于**统一渲染架构(Unified Shader Architecture)**的GpU核心!在这种架构下,顶点着色器、像素着色器和未来的计算着色器,将共享同一套可编程的、高度并行的计算资源。这将极大地提高GpU的灵活性和计算效率!”
“另外,”卡特补充道,“我们还需要关注并行计算ApI和软件生态的建设。仅仅有强大的硬件是不够的,必须要有像Nvidia的cUdA那样(虽然cUdA此时尚未发布,但类似的概念已经在学术界讨论),能够让开发者方便地利用GpU进行通用计算的编程模型和工具链!”
“没错!”刚刚加入的周明远教授立刻接话道,“硬件架构的创新必须与软件生态紧密结合!特别是编译器!我们需要开发出能够充分理解底层硬件架构、自动进行并行化优化、并将高级语言(如c++, opencL,甚至未来可能出现的领域特定语言)高效映射到GpU硬件上的智能编译器!这甚至比硬件本身更具挑战性!”
林轩看着眼前这三位分别代表着cpU架构、GpU架构和软件工具链领域顶尖水平的专家,因为共同的技术愿景而激动地讨论着,心中充满了欣慰。这正是他想要的“夸父”团队的雏形——小而精,每个人都是独当一面的帅才,目标远大,思想碰撞,相互启发。
“非常好!”林轩总结道,“cpU兼容ARm指令集,自研高性能乱序微架构;GpU采用统一渲染架构,瞄准GpGpU;软件层面,同步开发高效的并行编译器和工具链。这就是我们‘夸父’项目未来几年最重要的三大技术方向!”
“我再次强调,”林轩看着他们,语气严肃,“‘夸父’项目,不追求短期回报,不设定具体的商业目标,甚至允许失败!我给你们的唯一要求,就是瞄准世界最前沿,做出真正原创性的、能够奠定启明芯未来十年技术根基的核心成果!”
“人手不够,我去挖!经费不足,我来批!需要什么设备、什么资源,只要地球上能买到的、能找到的,我都会尽力满足!”林轩给予了他们近乎无限的支持承诺,“你们只需要心无旁骛,去攀登那座属于计算科学的‘珠穆朗玛峰’!”
王志刚、约翰·卡特、周明远,三位技术巨擘的眼中都燃烧起了熊熊的火焰。能够遇到这样一位既懂技术、又有远见、还愿意给予如此信任和投入的老板,对于任何一个有追求的工程师或科学家来说,都是梦寐以求的机遇。
“林总,请放心!”王志刚代表三人郑重承诺,“我们必将竭尽全力,不负所托!定要让‘夸父’之名,响彻世界!”
这场在秘密实验室里举行的、只有四个人的“启动会”,没有香槟,没有鲜花,甚至没有明确的KpI。但它所点燃的,是启明芯在核心计算领域自主探索的星星之火。这束火光虽然微弱,但它承载着一个无比宏大的梦想。未来,它或许真的能够像神话中的夸父那样,追上甚至超越那些遥遥领先的“太阳”,在cpU和GpU这片关乎国家信息产业命脉的核心战场上,开创出一片属于中国芯的新天地。
“夸父”逐日,征途开启。