據(jù)路透社8月21日報道,21日,中國人工智能初創(chuàng)企業(yè)深度求索發(fā)布其旗艦模型DeepSeek-V3的升級版。該公司表示,新版本采用了一項針對國產(chǎn)芯片而設計的技術(shù),能夠?qū)崿F(xiàn)性能優(yōu)化,并加快處理速度。
對國產(chǎn)芯片兼容性的關(guān)注可能表明,在北京因華盛頓的出口限制而推動取代美國技術(shù)之際,深度求索的人工智能模型將適配中國日益強大的半導體生態(tài)系統(tǒng)。
此前,深度求索發(fā)布的Deepseek人工智能模型震驚了科技界,因為其模型能夠與美國開放人工智能研究中心(OpenAI)的聊天生成預訓練轉(zhuǎn)換器(ChatGPT)等西方模型匹敵,同時提供更低的運營成本。
在此次升級到DeepSeek-V3.1模型之前,其核心模型近期還進行了兩次更新——5月份DeepSeek-R1模型更新和3月份DeepSeek-V3模型更新。
DeepSeek微信公眾號發(fā)文稱,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度,是針對“即將發(fā)布的下一代國產(chǎn)芯片”設計。
該公司沒有說明將支持哪些具體芯片型號或制造商。
該公司21日在微信公眾號上表示,DeepSeek-V3.1的特點之一是混合推理架構(gòu):一個模型同時支持思考模式與非思考模式。
微信審核 | 鄧媛
內(nèi)容編審 | 王緬 梁濤
微信編輯 | 董磊
【未經(jīng)授權(quán),嚴禁轉(zhuǎn)載!聯(lián)系電話028-86968276】