97人人操-超碰2024-黄色免费网站在线观看-日韩大骚逼-国产免费一区二区-人人干人人操人人射-久久精品国产亚洲AV高清热看看-亚洲草草草-91看成人小电影-靠逼的网站

      每日經(jīng)濟(jì)新聞
      首發(fā)快訊

      每經(jīng)網(wǎng)首頁(yè) > 首發(fā)快訊 > 正文

      華泰證券:DeepSeek有望加速模型訓(xùn)練與CUDA解耦

      每日經(jīng)濟(jì)新聞 2025-02-21 08:03:02

      每經(jīng)AI快訊,華泰證券研究認(rèn)為,DeepSeek在V3中使用了相比CUDA更底層的PTX 來(lái)優(yōu)化硬件算法,PTX是CUDA編譯的中間代碼,在CUDA和最終機(jī)器碼之間起到橋梁作用。而NSA則使用了OpenAl提出的Triton編程語(yǔ)言高效編寫(xiě)GPU代碼,Triton的底層可調(diào)用CUDA,也可調(diào)用其他GPU語(yǔ)言,包括AMD的rocm以及國(guó)產(chǎn)算力芯片語(yǔ)言,如寒武紀(jì)的思元590芯片和海光信息的深算一號(hào)(DCU)內(nèi)置的HYGON ISA指令集。LLM的訓(xùn)練短期內(nèi)雖未完全脫離CUDA 生態(tài),但DeepSeek NSA的推出使其初步呈現(xiàn)出與CUDA解耦的趨勢(shì),并為后續(xù)適配更多類(lèi)型的算力芯片奠定基礎(chǔ)。以異騰為代表的國(guó)產(chǎn)算力已經(jīng)很好的適配了DeepSeek-R1 等國(guó)產(chǎn)模型,并取得了高效推理的效果,華泰證券認(rèn)為,伴隨海外算力的受限,針對(duì)國(guó)產(chǎn)算力的優(yōu)化或?qū)⒂谐掷m(xù)進(jìn)展,值得重視。

      如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
      未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

      讀者熱線:4008890008

      特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

      歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

      每經(jīng)經(jīng)濟(jì)新聞官方APP

      0

      0