29_01_2025星島日報（歐洲版）

中國人工智能初創企業「深度求索（DeepSeek）」近期如旋風般席捲全球AI圈，尤其造成美國AI科技圈極度震撼。讓人驚奇的是，這家公司沒有外界推論的高深莫測的奇才，團隊規模不到140人，但「人才密度」極高，成員多是來自清華、北大、北航等頂尖高校的應屆博士畢業生、在讀生以及碩士生。值得一提的是，團隊沒有「海歸」，完全本土人才。 ▍本報訊 ▍ 綜合媒體報道，DeepSeek正式發布DeepSeek R1後，因超高性能和AP I調用成本低，震驚市場。但出色的成就與其團隊規模形成鮮明對比，員工規模不及 OpenAI的1/5，運算元、推理框架、多模態等研發工程師及深度學習方面的研究人員有約70人，主要在北京分部，其餘人在杭州總部，多為前端、產品以及商務人員。此前，OpenAI前政策主管、 Anthropic聯合創始人Jack Clark認為DeepSeek僱用了「一批高深莫測的奇才」。對此，DeepSeek創始人梁文峰受訪時曾透露，公司並沒有甚麼高深莫測的奇才，都來自Top 高校的畢業生、沒畢業的博士四年級、博士五年級實習生，還有一些畢業才幾年的年輕人。他說，在人工智能領域，「前50名頂尖人才可能不在中國，但也許我們能自己打造這樣的人。」梁文鋒秉持「看能力，不看經驗」的理念：「選人的標準一直都是熱愛和好奇心」，因此吸引了大量年輕高潛人才，讓眾多35歲以下、工作經驗不超5年的年輕人有充分的施展才華的舞台。選人標籤：年輕高潛從目前已有公開報道中可以看出，DeepSeek團隊最大的特點是名校、年輕，即使是團隊Leader級別，年紀也多在35歲以下。不到 140人的團隊，工程師和研發人員幾乎都來自清華大學、北京大學、中山大學、北京郵電大學等國內頂尖高校，工作時間都不長。有負責大模型領域挖掘高端科技人才的獵頭告訴《澎湃科技》， DeepSeek的用人邏輯和大模型領域其他公司的並無太大差異，核心標籤都是「年輕高潛」，即年齡在1998 年出生左右，工作經驗最好不要超過5年，「聰明、理工科、年輕、經驗少。」他表示，大模型創業公司本質是一家創業公司，並非不想招到海外頂尖AI人才，現實環境是海外頂尖AI人才願意回來的不多。公司交流氛圍好一位不願透露姓名的DeepSeek 員工透露，公司管理很扁平化，自由交流的氛圍比較好。梁文峰平日行蹤不定，大多數時間大家和他都是在線交流。該員工此前曾在國內大廠做大模型技術研發，但感覺自己在大廠更像一顆螺絲釘，無法創造價值，最終選擇加入DeepSeek。工作氛圍上，DeepSeek完全自下而上，自然分工，每個人對於卡和人的調動都不設上限。「自帶想法，不需要Push。在探索過程中，他遇到問題，自己就會拉人討論。」梁文鋒在團隊管理上，淡化職級，鼓勵自由討論和創新，成員依興趣選擇研究方向並自由組隊。當一個有潛力的構想出現時，公司會自上而下調配資源。而且，成員對資源和人員的調動不設上限，不存在層級和跨部門的限制，只要有想法，隨時可以靈活調用。「DeekSeek取得的成功也讓大家看到了年輕人的力量，從本質上來說這一代的AI發展更需要年輕的頭腦。」一位模型公司的人士說。「深度求索（DeepSeek）」刷屏全球各大主流媒體和社交網站，85後創始人梁文鋒頗受關注。綜合媒體報道，梁文鋒1985年出生於廣東湛江，自小展現出非凡數學天賦，初中就提前完成了高中數學課程，並開始學習大學數學。 2002年，他以吳川市第一中學「高考狀元」的成績考入浙江大學電子信息工程專業，隨後幾年裏繼續深造，於2010年獲得信息與通訊工程碩士學位，並在校期間對金融市場產生了濃厚的興趣。 2008年全球金融危機期間，梁文峰帶隊探索機器學習技術在全自動量化交易中的應用潛力。經過兩年努力，2010年滬深300股指期貨推出，量化投資迎來機遇，梁文峰和團隊賺取大量資金，自營資金超過5億元。 2013年，梁文峰與浙大同學徐進共同創立杭州雅克比投資管理有限公司，兩年後又成立杭州幻方科技有限公司，致力於通過數學和人工智能進行量化投資。2015年的市場波動中，幻方依靠先進的高頻量化策略取得了令人矚目的成績。 2016年，幻方推出首個基於深度學習的交易模型，並實現所有量化策略的AI化轉型。2018年正式確立了以AI為核心的發展戰略。2021 年，幻方的資產管理規模突破千億大關，躋身中國本土量化私募領域的「四大天王」之列。 2 0 2 3 年，梁文峰創辦深度求索De e p S e e k，專注於做真正人類級別的人工智能。2 0 2 4年5 月，DeekSeek宣布，其開源模型 DeepSeek-V2的推理成本被降到每百萬token僅一塊錢，約等於GPT4 Turbo的1/70。隨後，中國本土排名靠前的大模型先後跟進，最高降幅甚至高達97%。經此一役， DeepSeek解鎖了一個新綽號——AI 界的拼多多，迅速在AI領域佔據一席之地。而憑著其性能優越且性價比極高的大語言模型，DeepSeek被矽谷同行譽為「來自東方的神秘力量」。今年1月20日，中國務院總理李強主持召開專家、企業家和教科文衛體等領域代表座談會，聽取對《政府工作報告（徵求意見稿）》的意見建議。向來保持低調的梁文鋒在《中央電視台》新聞聯播首次亮相時說，DeepSeek能震撼美國，是因為它來自中國，而且AI要發展，必然需要有人站到技術的前沿。梁文鋒說，中國AI不可能永遠處在跟隨的位置，經常有人說中國 AI和美國有1、2年差距，但真實的落差是原創和模仿之差。如果這個不改變，中國永遠只能是追隨者，所以有些探索也是逃不掉的。有媒體將DeepSeek-R1與四款主流推理模型進行對比測試，結果顯示前者在難度最低的簡單邏輯推理基礎問題上表現不佳，但在高難度問題上表現出色，速度甚至打敗了OpenAI的o1模型。《每日經濟新聞》將DeepSeek 與Op e nA I的Ch a t GPT o 1、穀歌的Gemini 2.0 Flash Thinking Expe r imen t a l、字節跳動的豆包 1.5Pro和月之暗面的Kimi 1.5對比測試了3個問題，難度依次升級（一級到三級）。在3個燈泡問題上，五大模型全部通關；囚犯帽子顏色推理， DeepSeek、Kimi犯錯，Gemini耗時最短且完全正確；至於美國南加州大學博士資格考試數學題——找出所有階為147且不包含階為49的元素的兩兩不同同構群，o1用了4分 17秒找出三個解，但DeepSeek-R1 找出三個解只花了2分18秒，而其他模型只找出兩個解。測試結果意味著，DeepSeek存在一個反常識的問題，即在難度不高的問題上表現不如其他模型好，甚至可能會出現其他模型不會出現的錯誤。但當難度提升到專家級別的程度上時，它反而變成了最好模型。也就是說，對需要專業知識輔導的從業人員或研究人員來說， DeepSeek是一個好的選擇。去年底被小米始創人雷軍開出千萬天價年薪挖角的「95後AI才女」羅福莉，原來是來自DeepSeek。高中班主任李波證實消息，羅福莉曾參與DeepSeek開發。《紅星新聞》委託李波向羅福莉轉達採訪訴求，但對方回覆：「暫不方便接受採訪」。羅福莉2013年從宜賓一中畢業，提前獲北師大電腦專業錄取，後來保研北大。2022年離開阿里達摩院，轉行跳槽到幻方量化，再後來跳槽到DeepSeek任深度學習研究員，參與研發MoE大模型DeepSeek- V2.DeepSeek。在DeepSeek的一眾貢獻者中，高華佐和曾旺丁為MLA架構做出了關鍵創新，兩人從學校出來沒幾年。高華佐畢業於北大物理系畢業，曾旺丁來自北京郵電大學。 DeepSeek大模型另一大突破是通過一種名為GRPO的演算法，創新訓練方法，大大降低了成本。核心成員之一邵智宏此前是清華大學互動式人工只能（CoAI）課題組博士生，他曾服務於微軟研究院，加入 DeepSeek團隊之後，參與了多個重要項目的研發。 GRPO演算法創新的另一重要貢獻者朱琪豪，是北京大學電腦學院2024屆的博士畢業生。他的同學代達勱參與了DeepSeek大模型從V1 到V3每一代的研發。 ⱁꀡ☭氠"*捱艨մ䱌ⶨ⧲瑮ⳬ㕈ꓭ 둛곔䍳䲀槏牥㛇$IBU(15 P 「"*䩜㟗」劁⹪蕞ꪛ溭都來自國內頂尖高校核心成員是應屆生 DeepSeek㏬갠儱勔㏸☭䩜 ■DeepSeek在全球掀起一股熱潮，其創辦經過引發廣泛關注。路透社棪潂馼「㏔ꆽ筨⯂䧯卸」近年來，美國持續限制AI 芯片出口中國，但DeepSeek依然向世界展示了快速、低成本實現OpenAI o1同等模型能力的可能性。《黑神話：悟空》製作人馮驥評價DeepSeek具備有強大、便宜、開源、免費、聯網等5大特點，更重要的是它是一家「中國公司」，因此，它很可能會是一項「國運」級別的科技成果。《IT之家》報道，以《黑神話．悟空》遊戲爆紅的深圳遊戲科學創始人馮驥表示在網上發文談到DeepSeek R1推理模型時表示，如果有一個AI大模型做到了以下任何一條，都是超級了不起的突破，而DeepSeek全部同時做到了。這6條了不起的突破包括：比肩o1的推理能力；參數少，訓練開銷與使用費用低廉；任何人均可自行下載與部署；提供的服務完全免費；是目前唯一支持聯網搜索的推理模型；由年輕的小規模本土中國公司自主開發。馮驥大力推薦大眾使用 DeepSeek，希望DeepSeek R1會讓你對當前最先進的AI祛魅，讓AI逐漸變成你生活中的水和電。他說，「太幸運了，太開心了，這樣震撼的突破來自一個純粹的中國公司，知識與資訊平權至此又往前邁出了堅實的一步。」《華爾街日報》報道， O p e n A I 前高管扎克．卡斯直言，美國的限制未能阻止 DeepSeek的進步，「這凸顯了一個深刻的教訓：資源限制反而能激發創造力」。《環球時報》前主編胡錫進則指，DeepSeek讓美國AI界產生了危機感。他發文說，雖然 DeepSeek資源投入有限，不能像ChatGPT那樣全面、成熟，但其在整合搜索訊息、數學、代碼和大語言模型推理領域都走到了行業的最前列。DeepSeek在應對美國封鎖、培養中國年輕的頂級AI人才方面讓全社會眼前一亮，帶動了重塑全球AI格局新可能性的出現。前 50 名頂尖人才可能不在中國，但也許我們能自己打造這樣的人。 DeepSeek 創始人梁文峰 A5 29.01.2025 星期三兩岸要聞誰能入DeepSeek法眼聰明的年輕人看能力，「英雄不問經驗」，「選人標準一直都是熱愛和好奇心」；要求有其他公司從業經歷的僅「資深UI設計師」。歡迎「最強大腦」非常看重應聘者的「學術」和「研究能力」。比如「深度學習研究員」崗位，對在國際頂會或期刊發表相關論文明確優先招聘，同時也考察應聘者的競賽成績。偏好校招另外，相關校招的資訊也顯示， DeepSeek對校招和應屆生非常友好。諸多崗位都向學生群體開放，甚至有些崗位面向「在校生」。人物特寫 ■梁文鋒最近在央視新聞聯播上亮相。網上圖片羅福莉

Made with FlippingBook

RkJQdWJsaXNoZXIy ODc1MTYz