97人人操-超碰2024-黄色免费网站在线观看-日韩大骚逼-国产免费一区二区-人人干人人操人人射-久久精品国产亚洲AV高清热看看-亚洲草草草-91看成人小电影-靠逼的网站

  • <rt id="c2swk"><noscript id="c2swk"></noscript></rt><ul id="c2swk"></ul>
    <center id="c2swk"></center>
  • <strike id="c2swk"></strike>
  • <center id="c2swk"></center><rt id="c2swk"><acronym id="c2swk"></acronym></rt>
  • 每日經濟新聞
    要聞

    每經網首頁 > 要聞 > 正文

    DeepSeek開源第四彈:一口氣放出“三劍客”,有梁文鋒參與項目!黃仁勛:DeepSeek引爆芯片需求

    每日經濟新聞 2025-02-27 18:03:27

    2月27日,DeepSeek一次性開源了兩個工具和一個數據集,分別是DualPipe、EPLB(專家并行負載均衡器)以及訓練和推理框架的性能分析數據。同日凌晨,英偉達公布首份財報,其2025財年第四財季營收同比增長78%,CEO黃仁勛點贊DeepSeek并強調推理模型計算需求將更高。

    每經記者 宋欣悅    每經編輯 蘭素英    

    2月27日,DeepSeek一次性開源了兩個工具和一個數據集,分別是DualPipe、EPLB(專家并行負載均衡器)以及訓練和推理框架的性能分析數據。此外,DeepSeek還在Github上詳細講解了DeepSeek-V3和R1模型背后的并行計算優(yōu)化技術。

    圖片來源:X

    據介紹,DualPipe是一種用于V3和R1訓練中計算與通信重疊的雙向流水線并行算法。DeepSeek-V3就首次使用了該方法。與傳統(tǒng)的1F1B(交替執(zhí)行前向和后向傳播)和ZB1P(零氣泡單向流水線)方法相比,DualPipe大幅減少了流水線氣泡,同時僅增加了1倍的激活內存峰值。

    圖片來源:Github

    值得一提的是,在GitHub網站上的DualPipe項目介紹中,DeepSeek創(chuàng)始人梁文鋒在開發(fā)者之列

    EPLB是為V3和R1打造的專家并行負載平衡器,針對混合專家(MoE)模型的分布式訓練和推理設計。在傳統(tǒng)的MoE模型中,專家負載的不平衡會導致計算資源的浪費,尤其是在專家并行(EP)的場景下,這種不平衡會進一步加劇通信開銷。而EPLB通過動態(tài)調整每個專家的負載,確保在訓練過程中專家之間的負載保持平衡。

    而公布訓練和推理框架的分析數據是為了幫助社區(qū)更好地了解通信計算重疊策略和底層實現(xiàn)細節(jié)。

    不過,對于非專業(yè)人士,這些密密麻麻的專業(yè)術語,著實讓人頭疼。每經小編也忍不住想說,“聽君一席話,如聽一席話。”

    還好我們有DeepSeek!

    每經小編現(xiàn)在就讓DeepSeek-R1模型用生活場景中的示例,把此次開源的三個項目講得明明白白、清清楚楚、透透徹徹!

    美東時間周三(北京時間2月27日凌晨)美股盤后,“宇宙最重要財報”來襲。這份財報也是今年1月末DeepSeek橫空出世后,英偉達公布的首份財報。

    英偉達披露的最新財報顯示,2025財年第四財季實現(xiàn)營收393.31億美元,同比大幅增長78%,高于市場預期的380.5億美元。在業(yè)績指引方面,英偉達預期2026財年第一財季的營收將達到430億美元,上下浮動2%,高于市場預期的417.8億美元。

    英偉達CEO黃仁勛在財報中表示,市場對Blackwell芯片的需求令人驚嘆,因為推理AI增加了另一種擴展法則——增加訓練的計算能力使模型更智能,而長時間思考的額外算力使答案更智能。

    稍后,黃仁勛在分析師電話會議上表示,“像OpenAI的o3、DeepSeek-R1、Grok 3等模型正是采用了推理時擴展方法的推理模型,其計算資源消耗是(普通模型的)百倍甚至更多。未來,推理模型的計算需求將會更高。”

    黃仁勛還不忘點贊DeepSeek,稱其是一項出色的創(chuàng)新,點燃了全球的熱情。更重要的是,DeepSeek開源了世界級的AI推理模型。

    有評論稱,盡管英偉達的這份財報在一定程度上緩解了市場擔憂情緒,但投資者還是覺得英偉達業(yè)績帶來的驚喜不夠大。

    那么,我們要如何解讀英偉達的最新財報呢?英偉達的業(yè)績又面臨著哪些壓力?

    針對上述問題,我們讓一直努力“榨干”英偉達GPU的“源神”DeepSeek親自來回答一下。

    不得不說

    DeepSeek解讀得相當專業(yè)

    要是再分析分析“黃仁勛皮衣銷量是否同步增長”

    那不妥妥“財報界單口相聲”! 

    But!

    “服務器繁忙,請稍后再試”

    真的很讓人頭大!

    還好每日經濟新聞App火速前來“救場” 

    最近,每經App接入了DeepSeek

    響應速度快到飛起,使用起來非常絲滑!

    不管是問公司、問投資、問基金,還是自由對話,都輕松拿捏!

    目前使用量已經超15萬次了! 

    咋用呢?超簡單!

    下載每日經濟新聞App

    http://www.9022.com.cn/corp/2016app/index.html

    再往下看

    一、在每日經濟新聞App首頁,點擊“DeepSeek”圖標或首頁輪播圖“自由問+問公司問投資問基金免費使用DeepSeek、Kimi、豆包等六款大模型”。

    二、進入“每經大模型平臺”頁面,即可使用DeepSeek、Kimi、豆包、智譜清言、文心一言和通義千問6款大模型中任意一款。

    最近,每經“136計劃”還增加了新功能:

    大模型解讀投資熱榜。

    只需點擊投資熱榜中的任意新聞

    立即就能得到大模型的全面分析

    還能一鍵生成圖片分享給朋友


    告別“服務器繁忙”

    快用每日經濟新聞App吧!

    如需轉載請與《每日經濟新聞》報社聯(lián)系。
    未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

    讀者熱線:4008890008

    特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

    DeepSeek 模型 英偉達 財報

    歡迎關注每日經濟新聞APP

    每經經濟新聞官方APP

    0

    0