中國人工智能初創企業「深 度求索(DeepSeek)」近期如 旋風般席捲全球AI圈,尤其造 成美國AI科技圈極度震撼。讓 人驚奇的是,這家公司沒有外 界推論的高深莫測的奇才,團 隊規模不到140人,但「人才密 度」極高,成員多是來自清華、 北大、北航等頂尖高校的應屆 博士畢業生、在讀生以及碩士 生。值得一提的是,團隊沒有 「海歸」,完全本土人才。 ▍本報訊 ▍ 綜合媒體報道,DeepSeek正式 發布DeepSeek R1後,因超 高性能和AP I調用成本低,震驚 市場。但出色的成就與其團隊規 模形成鮮明對比,員工規模不及 OpenAI的1/5,運算元、推理框 架、多模態等研發工程師及深度學 習方面的研究人員有約70人,主要 在北京分部,其餘人在杭州總部, 多為前端、產品以及商務人員。 此前,OpenAI前政策主管、 Anthropic聯合創始人Jack Clark認 為DeepSeek僱用了「一批高深莫測 的奇才」。對此,DeepSeek創始人 梁文峰受訪時曾透露,公司並沒有 甚麼高深莫測的奇才,都來自Top 高校的畢業生、沒畢業的博士四年 級、博士五年級實習生,還有一些 畢業才幾年的年輕人。他說,在人 工智能領域,「前50名頂尖人才可 能不在中國,但也許我們能自己打 造這樣的人。」 梁文鋒秉持「看能力,不看經 驗」的理念:「選人的標準一直都是 熱愛和好奇心」,因此吸引了大量 年輕高潛人才,讓眾多35歲以下、 工作經驗不超5年的年輕人有充分 的施展才華的舞台。 選人標籤:年輕高潛 從目前已有公開報道中可以看 出,DeepSeek團隊最大的特點是 名校、年輕,即使是團隊Leader級 別,年紀也多在35歲以下。不到 140人的團隊,工程師和研發人員 幾乎都來自清華大學、北京大學、 中山大學、北京郵電大學等國內頂 尖高校,工作時間都不長。 有負責大模型領域挖掘高端科 技人才的獵頭告訴《澎湃科技》, DeepSeek的用人邏輯和大模型領域 其他公司的並無太大差異,核心標 籤都是「年輕高潛」,即年齡在1998 年出生左右,工作經驗最好不要超 過5年,「聰明、理工科、年輕、經 驗少。」他表示,大模型創業公司 本質是一家創業公司,並非不想招 到海外頂尖AI人才,現實環境是海 外頂尖AI人才願意回來的不多。 公司交流氛圍好 一位不願透露姓名的DeepSeek 員工透露,公司管理很扁平化,自 由交流的氛圍比較好。梁文峰平日 行蹤不定,大多數時間大家和他都 是在線交流。該員工此前曾在國內 大廠做大模型技術研發,但感覺自 己在大廠更像一顆螺絲釘,無法創 造價值,最終選擇加入DeepSeek。 工作氛圍上,DeepSeek完全 自下而上,自然分工,每個人對 於卡和人的調動都不設上限。「自 帶想法,不需要Push。在探索過程 中,他遇到問題,自己就會拉人討 論。」梁文鋒在團隊管理上,淡化 職級,鼓勵自由討論和創新,成員 依興趣選擇研究方向並自由組隊。 當一個有潛力的構想出現時,公司 會自上而下調配資源。而且,成員 對資源和人員的調動不設上限,不 存在層級和跨部門的限制,只要有 想法,隨時可以靈活調用。 「DeekSeek取得的成功也讓大 家看到了年輕人的力量,從本質上 來說這一代的AI發展更需要年輕的 頭腦。」一位模型公司的人士說。 「深度求索 (DeepSeek)」刷 屏全球各大主 流媒體和社交網站,85後創始人梁 文鋒頗受關注。 綜合媒體報道,梁文鋒1985年 出生於廣東湛江,自小展現出非凡 數學天賦,初中就提前完成了高中 數學課程,並開始學習大學數學。 2002年,他以吳川市第一中學「高 考狀元」的成績考入浙江大學電子 信息工程專業,隨後幾年裏繼續深 造,於2010年獲得信息與通訊工程 碩士學位,並在校期間對金融市場 產生了濃厚的興趣。 2008年全球金融危機期間,梁 文峰帶隊探索機器學習技術在全自 動量化交易中的應用潛力。經過兩 年努力,2010年滬深300股指期貨 推出,量化投資迎來機遇,梁文峰 和團隊賺取大量資金,自營資金超 過5億元。 2013年,梁文峰與浙大同學徐 進共同創立杭州雅克比投資管理有 限公司,兩年後又成立杭州幻方科 技有限公司,致力於通過數學和人 工智能進行量化投資。2015年的市 場波動中,幻方依靠先進的高頻量 化策略取得了令人矚目的成績。 2016年,幻方推出首個基於深 度學習的交易模型,並實現所有量 化策略的AI化轉型。2018年正式確 立了以AI為核心的發展戰略。2021 年,幻方的資產管理規模突破千億 大關,躋身中國本土量化私募領域 的「四大天王」之列。 2 0 2 3 年,梁文峰創辦深度 求索De e p S e e k,專注於做真正 人類級別的人工智能。2 0 2 4年5 月,DeekSeek宣布,其開源模型 DeepSeek-V2的推理成本被降到每 百萬token僅一塊錢,約等於GPT4 Turbo的1/70。隨後,中國本土 排名靠前的大模型先後跟進,最 高降幅甚至高達97%。經此一役, DeepSeek解鎖了一個新綽號——AI 界的拼多多,迅速在AI領域佔據一 席之地。而憑著其性能優越且性價 比極高的大語言模型,DeepSeek被 矽谷同行譽為「來自東方的神秘力 量」。 今年1月20日,中國務院總理 李強主持召開專家、企業家和教科 文衛體等領域代表座談會,聽取對 《政府工作報告(徵求意見稿)》的意 見建議。向來保持低調的梁文鋒在 《中央電視台》新聞聯播首次亮相時 說,DeepSeek能震撼美國,是因為 它來自中國,而且AI要發展,必然 需要有人站到技術的前沿。 梁文鋒說,中國AI不可能永遠 處在跟隨的位置,經常有人說中國 AI和美國有1、2年差距,但真實的 落差是原創和模仿之差。如果這個 不改變,中國永遠只能是追隨者, 所以有些探索也是逃不掉的。 有媒體將DeepSeek-R1與四款 主流推理模型進行對比測試,結果 顯示前者在難度最低的簡單邏輯推 理基礎問題上表現不佳,但在高難 度問題上表現出色,速度甚至打敗 了OpenAI的o1模型。 《每日經濟新聞》將DeepSeek 與Op e nA I的Ch a t GPT o 1、穀 歌的Gemini 2.0 Flash Thinking Expe r imen t a l、字節跳動的豆包 1.5Pro和月之暗面的Kimi 1.5對比測 試了3個問題,難度依次升級(一級 到三級)。 在3個燈泡問題上,五大模型 全部通關;囚犯帽子顏色推理, DeepSeek、Kimi犯錯,Gemini耗時 最短且完全正確;至於美國南加州 大學博士資格考試數學題——找出 所有階為147且不包含階為49的元 素的兩兩不同同構群,o1用了4分 17秒找出三個解,但DeepSeek-R1 找出三個解只花了2分18秒,而其 他模型只找出兩個解。 測試結果意味著,DeepSeek存 在一個反常識的問題,即在難度不 高的問題上表現不如其他模型好, 甚至可能會出現其他模型不會出現 的錯誤。但當難度提升到專家級別 的程度上時,它反而變成了最好模 型。 也就是說,對需要專業知識輔 導的從業人員或研究人員來說, DeepSeek是一個好的選擇。 去年底被小米始創人雷軍開出 千萬天價年薪挖角的「95後AI才女」 羅福莉,原來是來自DeepSeek。高 中班主任李波證實消息,羅福莉曾 參與DeepSeek開發。 《紅星新聞》委託李波向羅福莉 轉達採訪訴求,但對方回覆:「暫 不方便接受採訪」。 羅福莉2013年從宜賓一中畢 業,提前獲北師大電腦專業錄取, 後來保研北大。2022年離開阿里達 摩院,轉行跳槽到幻方量化,再後 來跳槽到DeepSeek任深度學習研究 員,參與研發MoE大模型DeepSeek- V2.DeepSeek。 在DeepSeek的一眾貢獻者中, 高華佐和曾旺丁為MLA架構做出 了關鍵創新,兩人從學校出來沒 幾年。高華佐畢業於北大物理系畢 業,曾旺丁來自北京郵電大學。 DeepSeek大模型另一大突破是 通過一種名為GRPO的演算法,創 新訓練方法,大大降低了成本。核 心成員之一邵智宏此前是清華大學 互動式人工只能(CoAI)課題組博士 生,他曾服務於微軟研究院,加入 DeepSeek團隊之後,參與了多個重 要項目的研發。 GRPO演算法創新的另一重要 貢獻者朱琪豪,是北京大學電腦學 院2024屆的博士畢業生。他的同學 代達勱參與了DeepSeek大模型從V1 到V3每一代的研發。 ⱁꀡ☭氠"*捱艨մ䱌ⶨ⧲瑮ⳬ㕈ꓭ 둛곔䍳䲀槏牥㛇$IBU(15 P 「"*䩜㟗」 劁蕞ꪛ溭 都來自國內頂尖高校 核心成員是應屆生 DeepSeek㏬갠儱勔㏸☭䩜 ■DeepSeek在全球掀起一股熱潮,其創辦經過引發廣泛關注。 路透社 棪潂馼 「㏔ꆽ筨⯂䧯卸」 近年來,美國持續限制AI 芯片出口中國,但DeepSeek依 然向世界展示了快速、低成本實 現OpenAI o1同等模型能力的可 能性。《黑神話:悟空》製作人馮 驥評價DeepSeek具備有強大、 便宜、開源、免費、聯網等5大 特點,更重要的是它是一家「中 國公司」,因此,它很可能會是 一項「國運」級別的科技成果。 《IT之家》報道,以《黑神 話.悟空》遊戲爆紅的深圳遊戲 科學創始人馮驥表示在網上發文 談到DeepSeek R1推理模型時表 示,如果有一個AI大模型做到 了以下任何一條,都是超級了不 起的突破,而DeepSeek全部同 時做到了。這6條了不起的突破 包括:比肩o1的推理能力;參 數少,訓練開銷與使用費用低 廉;任何人均可自行下載與部 署;提供的服務完全免費;是目 前唯一支持聯網搜索的推理模 型;由年輕的小規模本土中國公 司自主開發。 馮驥大力推薦大眾使用 DeepSeek,希望DeepSeek R1會 讓你對當前最先進的AI祛魅, 讓AI逐漸變成你生活中的水和 電。他說,「太幸運了,太開心 了,這樣震撼的突破來自一個純 粹的中國公司,知識與資訊平 權至此又往前邁出了堅實的一 步。」 《 華 爾 街 日 報 》報 道 , O p e n A I 前高管扎克.卡斯 直言,美國的限制未能阻止 DeepSeek的進步,「這凸顯了一 個深刻的教訓:資源限制反而能 激發創造力」。 《環球時報》前主編胡錫進 則指,DeepSeek讓美國AI界產 生了危機感。他發文說,雖然 DeepSeek資源投入有限,不能 像ChatGPT那樣全面、成熟, 但其在整合搜索訊息、數學、代 碼和大語言模型推理領域都走到 了行業的最前列。DeepSeek在 應對美國封鎖、培養中國年輕的 頂級AI人才方面讓全社會眼前 一亮,帶動了重塑全球AI格局 新可能性的出現。 前 50 名頂尖人才可能 不在中國,但也許我們能自 己打造這樣的人。 DeepSeek 創始人 梁文峰 A5 29.01.2025 星期三 兩岸要聞 誰能入DeepSeek法眼 聰明的年輕人 看能力,「英雄不問經驗」,「選人標 準一直都是熱愛和好奇心」;要求有其他 公司從業經歷的僅「資深UI設計師」。 歡迎「最強大腦」 非常看重應聘者的「學術」和「研究能 力」。比如「深度學習研究員」崗位,對在 國際頂會或期刊發表相關論文明確優先 招聘,同時也考察應聘者的競賽成績。 偏好校招 另外,相關校招的資訊也顯示, DeepSeek對校招和應屆生非常友好。 諸多崗位都向學生群體開放,甚至有些 崗位面向「在校生」。 人物特寫 ■梁文鋒最近在央視新聞聯播上亮 相。 網上圖片 羅福莉
RkJQdWJsaXNoZXIy ODc1MTYz