經(jīng)濟(jì)觀察網(wǎng)訊 7月24日,云天勵(lì)飛在上證e互動(dòng)平臺(tái)表示,公司2024年推出的IPU-X6000加速卡主要用于大模型云端推理,其內(nèi)置高效大模型推理DeepEdge200芯片,具有256T大算力、486GB/s超高帶寬、128GB大顯存、c2c mesh互聯(lián),可應(yīng)用于語言大模型、視覺大模型、多模態(tài)大模型等各類大模型推理加速領(lǐng)域。目前已經(jīng)支持適配云天書、通義千問、百川智能、智譜清言、Meta等30+開源大模型,涵蓋1.5B參數(shù)到70B參數(shù)量,預(yù)期能使大模型推理成本大幅度下降。(實(shí)習(xí)記者 李青陽 編輯 李仕靜)
上一篇
發(fā)表評(píng)論
2024-08-18 12:51:52 · 來自222.84.228.226回復(fù)
2024-08-18 13:01:16 · 來自139.215.205.219回復(fù)