97人人操-超碰2024-黄色免费网站在线观看-日韩大骚逼-国产免费一区二区-人人干人人操人人射-久久精品国产亚洲AV高清热看看-亚洲草草草-91看成人小电影-靠逼的网站

<tr id="osuhr"><label id="osuhr"></label></tr>

  • <td id="osuhr"><kbd id="osuhr"><cite id="osuhr"></cite></kbd></td>

      <li id="osuhr"></li>

    1. <rt id="osuhr"></rt>
      每日經(jīng)濟(jì)新聞
      要聞

      每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

      豆包大模型提出稀疏模型架構(gòu),推理成本較MoE最高可降83%

      每日經(jīng)濟(jì)新聞 2025-02-12 14:45:28

      每經(jīng)北京2月11日電(記者楊昕怡)豆包大模型團(tuán)隊(duì)今日宣布,團(tuán)隊(duì)提出了全新的稀疏模型架構(gòu)UltraMem,該架構(gòu)有效解決了MoE(混合專家模型)推理時(shí)高額的訪存問題,推理速度較MoE架構(gòu)提升2~6倍,推理成本最高可降低83%。該研究還揭示了新架構(gòu)的Scaling Law(規(guī)模定律),證明其不僅具備優(yōu)異的Scaling特性,更在性能上超越了MoE。

      如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
      未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

      讀者熱線:4008890008

      特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

      歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

      每經(jīng)經(jīng)濟(jì)新聞官方APP

      0

      0