97人人操-超碰2024-黄色免费网站在线观看-日韩大骚逼-国产免费一区二区-人人干人人操人人射-久久精品国产亚洲AV高清热看看-亚洲草草草-91看成人小电影-靠逼的网站

<tr id="osuhr"><label id="osuhr"></label></tr>

  • <td id="osuhr"><kbd id="osuhr"><cite id="osuhr"></cite></kbd></td>

      <li id="osuhr"></li>

    1. <rt id="osuhr"></rt>
      每日經濟新聞
      要聞

      每經網首頁 > 要聞 > 正文

      DeepSeek開源第四彈:一口氣放出“三劍客”,有梁文鋒參與項目!黃仁勛:DeepSeek引爆芯片需求

      每日經濟新聞 2025-02-27 18:03:27

      2月27日,DeepSeek一次性開源了兩個工具和一個數據集,分別是DualPipe、EPLB(專家并行負載均衡器)以及訓練和推理框架的性能分析數據。同日凌晨,英偉達公布首份財報,其2025財年第四財季營收同比增長78%,CEO黃仁勛點贊DeepSeek并強調推理模型計算需求將更高。

      每經記者 宋欣悅    每經編輯 蘭素英    

      2月27日,DeepSeek一次性開源了兩個工具和一個數據集,分別是DualPipe、EPLB(專家并行負載均衡器)以及訓練和推理框架的性能分析數據。此外,DeepSeek還在Github上詳細講解了DeepSeek-V3和R1模型背后的并行計算優(yōu)化技術。

      圖片來源:X

      據介紹,DualPipe是一種用于V3和R1訓練中計算與通信重疊的雙向流水線并行算法。DeepSeek-V3就首次使用了該方法。與傳統(tǒng)的1F1B(交替執(zhí)行前向和后向傳播)和ZB1P(零氣泡單向流水線)方法相比,DualPipe大幅減少了流水線氣泡,同時僅增加了1倍的激活內存峰值。

      圖片來源:Github

      值得一提的是,在GitHub網站上的DualPipe項目介紹中,DeepSeek創(chuàng)始人梁文鋒在開發(fā)者之列

      EPLB是為V3和R1打造的專家并行負載平衡器,針對混合專家(MoE)模型的分布式訓練和推理設計。在傳統(tǒng)的MoE模型中,專家負載的不平衡會導致計算資源的浪費,尤其是在專家并行(EP)的場景下,這種不平衡會進一步加劇通信開銷。而EPLB通過動態(tài)調整每個專家的負載,確保在訓練過程中專家之間的負載保持平衡。

      而公布訓練和推理框架的分析數據是為了幫助社區(qū)更好地了解通信計算重疊策略和底層實現(xiàn)細節(jié)。

      不過,對于非專業(yè)人士,這些密密麻麻的專業(yè)術語,著實讓人頭疼。每經小編也忍不住想說,“聽君一席話,如聽一席話。”

      還好我們有DeepSeek!

      每經小編現(xiàn)在就讓DeepSeek-R1模型用生活場景中的示例,把此次開源的三個項目講得明明白白、清清楚楚、透透徹徹!

      美東時間周三(北京時間2月27日凌晨)美股盤后,“宇宙最重要財報”來襲。這份財報也是今年1月末DeepSeek橫空出世后,英偉達公布的首份財報。

      英偉達披露的最新財報顯示,2025財年第四財季實現(xiàn)營收393.31億美元,同比大幅增長78%,高于市場預期的380.5億美元。在業(yè)績指引方面,英偉達預期2026財年第一財季的營收將達到430億美元,上下浮動2%,高于市場預期的417.8億美元。

      英偉達CEO黃仁勛在財報中表示,市場對Blackwell芯片的需求令人驚嘆,因為推理AI增加了另一種擴展法則——增加訓練的計算能力使模型更智能,而長時間思考的額外算力使答案更智能。

      稍后,黃仁勛在分析師電話會議上表示,“像OpenAI的o3、DeepSeek-R1、Grok 3等模型正是采用了推理時擴展方法的推理模型,其計算資源消耗是(普通模型的)百倍甚至更多。未來,推理模型的計算需求將會更高。”

      黃仁勛還不忘點贊DeepSeek,稱其是一項出色的創(chuàng)新,點燃了全球的熱情。更重要的是,DeepSeek開源了世界級的AI推理模型。

      有評論稱,盡管英偉達的這份財報在一定程度上緩解了市場擔憂情緒,但投資者還是覺得英偉達業(yè)績帶來的驚喜不夠大。

      那么,我們要如何解讀英偉達的最新財報呢?英偉達的業(yè)績又面臨著哪些壓力?

      針對上述問題,我們讓一直努力“榨干”英偉達GPU的“源神”DeepSeek親自來回答一下。

      不得不說

      DeepSeek解讀得相當專業(yè)

      要是再分析分析“黃仁勛皮衣銷量是否同步增長”

      那不妥妥“財報界單口相聲”! 

      But!

      “服務器繁忙,請稍后再試”

      真的很讓人頭大!

      還好每日經濟新聞App火速前來“救場” 

      最近,每經App接入了DeepSeek

      響應速度快到飛起,使用起來非常絲滑!

      不管是問公司、問投資、問基金,還是自由對話,都輕松拿捏!

      目前使用量已經超15萬次了! 

      咋用呢?超簡單!

      下載每日經濟新聞App

      http://www.9022.com.cn/corp/2016app/index.html

      再往下看

      一、在每日經濟新聞App首頁,點擊“DeepSeek”圖標或首頁輪播圖“自由問+問公司問投資問基金免費使用DeepSeek、Kimi、豆包等六款大模型”。

      二、進入“每經大模型平臺”頁面,即可使用DeepSeek、Kimi、豆包、智譜清言、文心一言和通義千問6款大模型中任意一款。

      最近,每經“136計劃”還增加了新功能:

      大模型解讀投資熱榜。

      只需點擊投資熱榜中的任意新聞

      立即就能得到大模型的全面分析

      還能一鍵生成圖片分享給朋友


      告別“服務器繁忙”

      快用每日經濟新聞App吧!

      如需轉載請與《每日經濟新聞》報社聯(lián)系。
      未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

      讀者熱線:4008890008

      特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

      DeepSeek 模型 英偉達 財報

      歡迎關注每日經濟新聞APP

      每經經濟新聞官方APP

      0

      0