DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,是一家成立于2023年的創新型科技公司,由知名私募巨頭幻方量化孕育而生,專注于開發先進的大語言模型(LLM)和相關技術。憑借強大的深度學習能力和廣泛的應用場景,DeepSeek在全球科技領域引發廣泛關注。
隨著國產開源大模型DeepSeek的強勢出圈,其背后的核心團隊也引起了廣泛專注。資料顯示,DeepSeek的創始人為梁文鋒,公司核心團隊的最大特點是年輕,核心技術崗位基本上以應屆和畢業一兩年的人為主,許多成員的工作時間都不長,不少還是在讀博士。除此之外,DeepSeek團隊成員也多來自中國本土市場,工程師和研發人員幾乎都來自清華大學、北京大學、中山大學、北京郵電大學等國內頂尖高校,鮮有“海歸”。
*DeepSeek主創團隊名單是小編根據公開資料整理而得。名單僅供參考和幫助,歡迎在末尾交流探討。
梁文鋒,畢業于浙江大學,擁有信息與電子工程學系學士和碩士學位,杭州幻方科技有限公司、DeepSeek創始人。在他的帶領下,DeepSeek對人才極其看重,不看經驗,只看能力。
高華佐,畢業于北京大學物理系,為MLA架構做出了關鍵創新。
曾旺丁,畢業于北京郵電大學,研究生導師是北郵人工智能與網絡搜索教研中心主任張洪剛,其為MLA架構做出了關鍵創新。
邵智宏,清華大學交互式人工智能(CoAI)課題組博士生,師從黃民烈教授。曾在微軟研究院工作過,是DeepSeekMath核心作者之一,此外還參與了DeepSeek-Prover、DeepSeek-Coder-v2、DeepSeek-R1等項目。
朱琪豪,北京大學計算機學院軟件研究所2024屆博士畢業生,受熊英飛副教授和張路教授指導,研究方向為深度代碼學習。朱琪豪是DeepSeekMath核心作者之一,此外還基于他的博士論文工作,主導開發了DeepSeek-Coder-V1。
Peiyi Wang,北京大學博士生,受北京大學計算語言學教育部重點實驗室穗志方教授指導,是DeepSeekMath核心作者之一。
代達勱,2024年博士畢業于北京大學計算機學院計算語言所,師從穗志方教授,他從V1就加入到DeepSeek,一直到V3。
趙成鋼,畢業于清華大學,大二時成為清華學生超算團隊正式成員,三次獲得世界大學生超算競賽冠軍,曾在英偉達實習,在DeepSeek中擔任訓練/推理基礎架構工程師。
吳俁,2019年博士畢業于北京航空航天大學,博士期間接受北航李舟軍教授和MSRA前副院長周明博士的聯合培養,曾在微軟MSRA參與過小冰和必應百科項目,是DeepSeek后訓練團隊的負責人。
郭達雅,2023年博士畢業于中山大學,由中山大學印鑒教授與MSRA周明博士聯合培養,2024年7月加入DeepSeek,主要參與了一系列數學和代碼大模型的工作。