杨植麟,男,1993年出生于广东汕头,本科毕业于清华大学计算机系,博士毕业于卡内基梅隆大学计算机学院。他是北京月之暗面科技有限公司(Moonshot AI)的创始人,并主导开发了Moonshot大型模型以及基于该模型的Kimi智能助手。
2015年,杨植麟进入卡耐基·梅隆大学(CMU)语言技术研究所(LTI)攻读博士学位。2017年和2018年,杨植麟连续入选机器学习和NLP领域一流会议和期刊的第一作者全球排行榜。2020年2月,杨植麟参加“智源论坛 Live | 青年科学家线上报告会”。2023年4月17日,杨植麟作为创始人之一创办了AI科技公司北京月之暗面科技有限公司并持股78.97%。2024年2月20日,杨植麟创办的AI创业公司月之暗面完成了一轮超过10亿美元的融资。
杨植麟在学术和职业生涯中屡获殊荣。2018年,他成为英伟达学者。紧接着在2019年,他荣获了西贝尔学者(Siebel Scholars)的称号。在2020年11月,他入围了“2020福布斯中国30岁以下精英榜”。2025年4月30日,杨植麟获评2025“北京榜样·青年榜样”。
人物经历
早年经历
杨植麟,广东汕头人,2011年毕业于汕头市金山中学。高中时期,没有任何编程基础的杨植麟被选拔进全国青少年信息学奥林匹克竞赛培训班,之后在全国青少年信息学奥林匹克联赛中夺得广东省赛区一等奖,因此获得清华大学保送生资格,并于2011年毕业,高考成绩为667分,远超清华大学在广东的录取线。同年被清华大学热能工程系录取,但在大二转专业进入计算机系,在清华大学计算机系知识工程实验室(KEG)师从唐杰教授。
2015年,杨植麟进入卡耐基·梅隆大学(CMU)语言技术研究所(LTI),跟随苹果公司AI负责人Ruslan Salakhutdinov和Google AI智能首席科学家William W. Cohen攻读博士学位。毕业后,杨植麟曾效力于谷歌大脑研究院和Meta(Facebook)人工智能研究院。2016年创办销售科技领域企业服务公司循环智能(Recurrent AI)。2017年和2018年,杨植麟连续入选机器学习和NLP领域一流会议和期刊的第一作者全球排行榜。2019年,杨植麟获得卡耐基·梅隆大学计算机专业博士学位。
工作经历
2023年4月17日,杨植麟作为创始人之一创办了AI科技公司北京月之暗面科技有限公司并持股78.97%。6月,在硅谷极具影响力的科技媒体The Information中,杨植麟成为“中国OpenAI”的五个候选之一。10月,推出支持输入20万汉字的智能助手产品kimi迅速走红。11月29日,杨植麟表示,规模化是通向AGI的核心,而随着模型不断迭代,长文本会逐渐取代微调,成为定制模型的关键技术。但通过滑动窗口、降采样、小模型等技术捷径实现上下文窗口延长,都是“技术捷径”。2024年2月20日,杨植麟创办的AI创业公司月之暗面完成了一轮超过10亿美元的融资,投资方包括红杉中国、小红书、美团、阿里巴巴集团等,老股东也跟投。这标志着月之暗面自2023年获得超过2亿美元融资以来的重要里程碑。公司估值已达约25亿美元,成为国内大模型领域的领先企业之一。有媒体称,这也是自ChatGPT掀起全球浪潮以来,国内AI大模型公司获得的单轮最大金额融资。
2025年2月18日,杨植麟带领团队发布论文《MoBA: MIXTURE OF BLOCK ATTENTION FOR LONG-CONTEXT LLMS(直译为“MoBA:面向长上下文大语言模型的块注意力混合方法”)》。
人物活动
2020年2月,杨植麟参加“智源论坛 Live | 青年科学家线上报告会”,做了题为《Latest Advances of Neural Language Models》的主题演讲。
2023年7月6日,以“智联世界·生成未来”为主题的世界人工智能大会(WAIC 2023)在上海世博中心拉开大幕,杨植麟出席并分享了他的创新理念和成果转化的经验。
2024年5月18日,第五届上海市创新创业青年50人论坛上,杨植麟分享了自己的创业经历与心得。2024年9月19日,杨植麟出席并演讲杭州云栖小镇举办的2024云栖大会
2025年3月27日,在 2025 年中关村论坛人工智能主题日上,杨植麟作为产业界专家,围绕大模型产业发展作主题演讲 ,并以人工智能创新生态建设为主题,参与发布空间生态、模型应用、具身智能、算力资源、人才要素等各方面的举措与行动。
学术研究成就
研究方向
参考资料
主要成就
杨植麟在深度学习和自然语言处理领域有深入研究且取得了显著成果。其作为第一作者与卡耐基·梅隆大学、Google Brain 团队联合推出NLP 领域热门的国际前沿预训练 XLNet 模型,在 20 个标准任务上超过了曾经保持最优性能记录的 Google BERT 模型,并在18个标准任务上取得历史最好结果,入选NeurIPS 2019 Oral。作为共同第一作者提出 Transformer-XL 模型并在多项主流序列建模数据集上取得历史最好结果。Google 学术引用超 2400 次。
在中国人工智能学会CAAI和清华大学联合发布的《2019人工智能发展报告》中,杨植麟为第一作者的 XLNet 被称为“BERT 之后的重要进展”。2019年,XLNet 论文被多家 AI 媒体机构评选为年度深度学习论文 TOP10,包括 TopBots、Heartbeat和Rubik's Code等。2017年和2018年,杨植麟连续入选机器学习和NLP领域一流会议和期刊的第一作者全球排行榜,全球仅有三名学者两年皆入选。
杨植麟和创始团队核心成员参与了 谷歌 Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,多项核心技术被Google Palm、Meta LLaMa、Stable Diffusion等主流产品采用。此外,杨植麟和团队的很多作为第一作者和核心贡献者发明了的技术,被许多主流的产品多采用,比如,LLaMA使用了杨植麟和团队开发的的Positional encoding技术,Stable Diffusion网络架构里面的两个核心的架构,里面的Group Organization也是由杨植麟和团队开发的。
论文发表
参考资料
获得荣誉
人物事件
2024年11月11日,月之暗面创始人杨植麟、联合创始人兼CTO张宇韬,被循环智能投资人在香港特别行政区提起仲裁,相关电子仲裁申请书也已递交香港国际仲裁中心,提起仲裁的理由是,杨植麟和张宇韬等人在获得5家投资方的同意豁免书之前,就已启动融资并创立月之暗面。杨植麟、张宇韬委托铭德律师事务所处理仲裁事项,律师团队明确表示将就仲裁申请提出全面抗辩,认为指控“既缺乏法律依据,也不具备事实基础”。
人物评价
创投行业评价杨植麟“很聪明,有技术号召力”,但对于抢抓机会窗口与遵循商业规则之间如何平衡的现实困境,成为其亟待解决的困局。杨植麟的创业历程,从早期在NLP领域取得的卓越学术成就,到带领团队打造出具有行业竞争力的Kimi,他始终怀揣着对技术创新的执着追求,致力于推动 AI 技术在实际应用场景中的落地。(蓝鲸新闻评)
杨植麟不但是个学霸,更是多才多艺。他本可在海外企业拿着高薪享受生活,却为了成就一番事业白手起家、从头干起。在他的心中,一直坚信:只要是坚持去做对行业有价值的事情,商业回报一定会成功的。当下,有不少怀揣着梦想的年轻人,却在实现梦想的路上踌躇不前。杨植麟用行动告诉了我们,在实现梦想的路上要敢于去尝试,创业要大胆但不能盲目,但当我们认清了自己的路就要义无反顾的往前冲。(汕头日报评)