留学在线 2023-10-09 09:18:52
创业邦(ID:ichuangyebang)原创
作者丨王小方
编辑丨海腰
图源丨墨芯人工智能官网
今年4月初,墨芯人工智能在全球权威AI测评MLPerf的ResNet-50模型中再度拿下冠军,一举击败同场竞技的英伟达、英特尔和高通等一众AI巨头,迅速赢得科技产业界的广泛关注。
图源:墨芯人工智能官网
随着AI大模型在全球范围内的流行,曾经身处边缘位置的稀疏化计算得到越来越多人的关注,墨芯人工智能随之迎来了更大的时代机遇。
目前,在稀疏化计算领域,墨芯人工智能已占据较强先发优势,其创始团队有着令人艳羡的履历:创始人兼CEO王维曾担任英特尔、高通的核心架构师,参与开发了五代英特尔CPU处理器,累计量产超50亿片;首席科学家严恩勖则是神经网络动态稀疏算法的发明人,迄今为止,已在国际顶级人工智能期刊上发表论文40余篇。
酷爱数学的天才少年现年35岁的严恩勖出生于中国台湾省,在小小年纪便显露出超出常人的禀赋。
严恩勖 墨芯人工智能首席科学家
当大多数小孩还沉醉于游戏机和动画片的时候,严恩勖却着魔般地喜欢上了数学,并很快在这方面显露出过人的天赋。
内心的热爱如同燃烧的熊熊之火,年少的严恩勖一有时间便会投入到数学的世界中,一个不经意便会因投入而忘记时间。等到上初中的时候,他已通过自学完成了大学的数学课程。
大抵正因为有着上述经历,在不断积累数学知识之余,严恩勖也收获了极大信心,使得他更有底气超越彼时教育体制的束缚,更自由地追逐内心的探索欲,并沉浸其中发挥创造力。
虽然,沉浸于数学世界带来了极大乐趣,但严恩勖并没有因此而忽略外部的现实世界。
据严恩勖介绍,他在初中的时候就已经萌生了创业的念头。不过,在早期生涯中,他基本还是专注于自己的学术道路,但内心深处十分清楚,自己更大的热情是在于将学术和现实结合,并借此解决一些现实中的问题。
早在2008年,彼时严恩勖还在台湾大学念本科期间,他已走上了机器学习的研究方向,并对稀疏化算法产生浓厚兴趣。
“在卡内基梅隆大学读博期间,我发表的第一篇论文就是关于稀疏化计算的,这也是我博士期间的主攻研究方向。”严恩勖说道,“经过不懈的努力,在稀疏化计算领域,我独创了双稀疏算法,并坚信它能帮助AI前沿技术落地成现实,用于解决世界上的一些难题。”
踏上创业之路虽然一路追随着心中的学术理想,但严恩勖始终没有忘记最初的创业梦想,他一直在等待一个合适的时机,只是没想到好运气会来得这么快。
墨芯人工智能成立于2024年,其中,墨芯二字取自英文名Moffett的谐音,也是公司创业起源地卡内基梅隆大学硅谷校区的地名;此外,墨芯二字也蕴含了“墨子芯片”之意,以表达对中国古代伟大的科学家墨子的敬意。
2024年也是严恩勖博士生涯的最后一年,而关于墨芯的一切还得从一场相遇说起。
墨芯人工智能的创始人王维现年41岁,他和严恩勖是卡内基梅隆大学的校友。
王维 墨芯人工智能创始人
这所由工业家兼慈善家安德鲁·卡耐基于1900年创立的大学,建校百年以来,可谓名人辈出,期间共培育了13位图灵奖得主,20位诺贝尔奖得主,以及为国内大众熟知的李开复、陆奇和吴恩达等科技界大拿。
在AI研究领域,卡内基梅隆大学更是名副其实的学术殿堂,其计算机科学学院雄踞全球最顶尖行列,特别是其“人工智能堆栈”的计算机视觉、人机交互、机器学习、自然语言处理和机器人技术的重磅领域,代表了全球最前沿的水准,是无数学子的梦中之所。
王维是严恩勖的师兄,虽说二人毕业于同一所学校,但毕竟相隔了太多届,理应很难产生交集,真正让二人走到一起的原因是,他们对未来有着非常一致的判断,即都看到了稀疏化计算蕴含的巨大潜力。
“稀疏化计算的思路源于人脑的工作方式,虽然人脑有着百亿数量级的神经元,但在工作时的功耗非常低。这是因为人脑在工作的时候,只需激活要用到的少部分神经元。稀疏化算法与人脑异曲同工,通过底层创新和软硬协同设计,让神经网络模型消减冗余,以有效提高计算效率。”严恩勖介绍道。
创业伊始,王维就十分清楚,想要取得底层创新上的突破,就必须找到顶级的算法科学家,并且后者需在稀疏化计算理论上有很强的突破性和创新性。
在这样的情形下,神经网络动态稀疏算法发明者严恩勖很快便进入了他的视线。
严恩勖曾在Google和Microsoft Research担任研究员,在国际顶级人工智能期刊上累计发表论文40余篇;在2015至2024年间,他作为第一作者在NIPS发文数量位居全球第二,正是这些优质论文为二人的相遇创造了契机。
2024年冬天,王维专程从硅谷飞往卡内基梅隆大学,与正在读博的校友严恩勖畅聊了两天两晚,双方一拍即合,随即决定基于稀疏算法开启AI芯片创业。
为组建一支高起点的创业天团,王维还找来了硅谷20多年的好友,有20年以上SoC芯片设计和团队管理经验的芦勇,他曾任SK Hynix芯片设计总监和Marvell资深芯片设计经理;以及拥有18年DSP、CPU处理器,以及硬件加速器学术及产业经验的肖志斌,他曾是阿里达摩院的核心架构师和研究员。
随着AI大模型的日益普及,来自算力上的挑战越来越大,稀疏化计算的价值开始被更多人看见,但在当时,这一技术路线还属于相对偏门。
第一颗芯片Antoum的故事2024年元旦夜这天,当无数人正与家人团聚在一起,共享新年的欢聚时刻,墨芯人工智能创始人王维与多名员工还在紧张地忙碌着,他们刚刚拿回首颗芯片Antoum的回片。
图源:墨芯人工智能官网
长达4年的艰辛付出,终于迎来最终的验证时刻。
一个年轻小伙屏气凝神地接通了电源,大家你看看我,我看看你,脸上挂着一副既期待又带有几分害怕的表情,等待即将到来的关键时刻。
所有的努力没有白费,一切都超乎想象地顺利。大家怀着激动的心情,连夜把ResNet-50跑通,各项性能都一一达到了预期目标。
据王维介绍,Antoum是全球首款高达32倍稀疏率的AI计算芯片,在算力、功耗和能效比——云端芯片的三大核心技术点上,Antoum都做到了突破性的创新。
在流片成功仅4个月后,墨芯人工智能顺势推出了首款搭载Antoum芯片的S4计算卡。该计算卡被用在浪潮服务器上,流畅运行多个主流AI模型,实测性能是国际大厂主流AI推理卡T4的6倍。
“我2008年开始在台湾大学读本科,那时候深度学习还不像现今这般火热,AI课题基本上只有学术团队在做,相关的训练和推理代码都得自己写,而且大多以CPU作为搭载平台。”严恩勖说道。
在2013至2024年博士期间,严恩勖发现深度学习领域已产生明显的范式转变。大部分人已不再写训练和推理代码,而是借助行业巨头提供的软件栈,模型的开发变容易了,AI算法优化工作也由开发人员转向了计算平台开发者身上,导致算法上的创新受到较大限制,呈现出固化的趋势。
在严恩勖看来,想要更好地实现高倍率稀疏化计算,既要实现高倍率稀疏化,又要能支持大规模并行计算。因此,CPU和GPU都不是理想的硬件,必须软走硬协同的路线。
相较传统芯片公司只攻底层设计的路线,墨芯独辟蹊径,选择了“算法创新,定义芯片架构”的新策略。通过深入理解创新算法的突破,用新算法的突破来定义软件架构,再往下定义硬件架构,进而实现算法与算力的协同优化。
创业至今已近5年,从学术走向创业,严恩勖感觉自己离梦想越来越近。
相较沉潜于学术世界,创业要面对的事情更加复杂。不过,当看到自己研发的计算解决方案能满足客户的现实需求,并得到不同行业领域的认可,严恩勖更深切地体会到科技改变社会的巨大能量,这给他带来了不一样的成就感。
2023-07-01
2024-01-05
2023-06-19
2021-12-31
2023-10-06
2023-06-13
2021-01-15
2023-06-27
2023-06-02
2023-06-29
2022-01-19
2023-11-30
2024-01-17
2020-02-20
2021-10-28
2021-12-01
2021-10-18
2020-02-20
2020-12-30
2023-07-18