DeepSeek-V3性能優(yōu)越且成本較低,中國大模型助力AI技術(shù)更開放更高效

2025-01-16 01:35:00 來源: 科技日報 點擊數(shù):

科技日報記者 李山

近日,中國初創(chuàng)企業(yè)DeepSeek開發(fā)的大語言模型(LLM)DeepSeek-V3引發(fā)美歐業(yè)界廣泛關(guān)注,該模型在技術(shù)性能、開源模式、成本效益等方面的突出表現(xiàn)獲得積極評價。開源的DeepSeek-V3是全球AI生態(tài)的一次重要變革,有助于美國之外的國家和地區(qū)在AI領(lǐng)域自主發(fā)展,推動全球AI技術(shù)向更加開放、多元和高效的方向邁進。

多項指標(biāo)媲美頂尖模型

根據(jù)測評機構(gòu)Artificial Analysis的獨立分析,DeepSeek-V3可與世界頂尖的AI模型競爭。在文本理解、編碼、數(shù)學(xué)和學(xué)科知識方面,DeepSeek-V3優(yōu)于Meta的Llama 3.1-405B和阿里巴巴的Qwen 2.5-72B等開源模型,并在性能上和世界頂尖的閉源模型OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet不分伯仲。DeepSeek-V3在中文處理、編碼和數(shù)學(xué)計算等方面的優(yōu)勢,使其在教育和科研領(lǐng)域具有巨大潛力。

DeepSeek-V3的開發(fā)和訓(xùn)練成本也明顯低于其他大模型。OpenAI創(chuàng)始成員之一安德烈·卡帕蒂強調(diào)了這種非凡的效率:像DeepSeek-V3這樣性能和級別的模型,通常需要1.6萬到10萬個GPU的集群來訓(xùn)練,而中國初創(chuàng)公司僅用了2048個GPU在57天內(nèi)便完成了訓(xùn)練。其成本約557.6萬美元,僅為其他主流模型(如GPT-4)的1/10左右。

另一方面,媒體則關(guān)注了所謂的“AI污染”、隱私保護和安全等問題。隨著互聯(lián)網(wǎng)上AI生成內(nèi)容的泛濫,AI模型在訓(xùn)練過程中會產(chǎn)生“幻覺”或誤導(dǎo)性答案。DeepSeek-V3的案例凸顯了在AI生成內(nèi)容日益普及的背景下,如何確保訓(xùn)練數(shù)據(jù)的純凈性和可靠性是個亟待解決的問題。

開源策略改變AI生態(tài)

DeepSeek之所以能實現(xiàn)巨大的效率提升,關(guān)鍵在于其算法、框架和硬件的協(xié)同設(shè)計。在美國企業(yè)AI模型的開發(fā)費用越來越昂貴之際,DeepSeek-V3的出現(xiàn)表明,即使沒有數(shù)十億美元的預(yù)算,也能開發(fā)出頂級AI。這對預(yù)算有限的企業(yè)和研究機構(gòu)來說是個好消息。這種高效訓(xùn)練方法被媒體稱為“AI領(lǐng)域的范式轉(zhuǎn)變”,這在當(dāng)前算力緊張的背景下尤為重要。

此外,DeepSeek-V3的開源策略也受到業(yè)界熱烈歡迎。像OpenAI這樣擁有大量用戶的公司收費高、不開源,卻仍然虧損數(shù)十億美元;而DeepSeek-V3以更便宜的價格提供頂級模型,而且還是開源的。這樣低的開發(fā)成本和激進的定價政策,讓很多AI企業(yè)倍感壓力。長遠看,這將沖擊到美國科技巨頭在AI市場的主導(dǎo)地位。

DeepSeek-V3證明了開源模型在性能和成本上已具備與閉源模型競爭的能力。這將促使更多企業(yè)重新評估其技術(shù)策略,尤其是在開源與閉源模式、硬件依賴與軟件創(chuàng)新之間的平衡。這有助于推動AI生態(tài)向更加開放的方向發(fā)展,促使更多企業(yè)加入開源陣營,為全球AI社區(qū)提供寶貴的資源,進而促進AI技術(shù)的普及。

突破“小院高墻”式封鎖

近年來,中美之間圍繞AI進行了激烈競爭。美國試圖通過日趨嚴(yán)苛的芯片出口禁令來限制中國AI的發(fā)展。1月13日,美國又推出新一輪AI芯片出口限制措施,希望將AI技術(shù)的發(fā)展集中在所謂的“友好國家和地區(qū)”,防止先進芯片流入“對手”國,并為全球AI發(fā)展設(shè)定美國標(biāo)準(zhǔn)。美國相關(guān)政策的制定者想當(dāng)然地認(rèn)為,除了美國以外沒有國家可提供高端GPU芯片及相應(yīng)算力,或是研發(fā)出替代算法和產(chǎn)品。然而,DeepSeek-V3的出現(xiàn)證明,美國“小院高墻”式的封鎖終將被技術(shù)創(chuàng)新所擊潰。

事實證明,美國的各種限制措施反而催生了中國在算法和架構(gòu)上的創(chuàng)新。中國的芯片技術(shù)在一步步提高,AI應(yīng)用領(lǐng)域的創(chuàng)新更是取得了明顯進步。DeepSeek-V3為中國AI生態(tài)的發(fā)展提供了新動力,也有利于全球AI技術(shù)向更加開放、多元和高效的方向邁進。

反觀歐洲,雖然各國政府高度重視AI技術(shù)和產(chǎn)業(yè)發(fā)展,但歐洲在AI發(fā)展過程中過于依賴美國大型科技公司的投資和技術(shù)支持,導(dǎo)致技術(shù)主權(quán)和市場競爭力被削弱。AI在推動新一輪科技革命和產(chǎn)業(yè)變革中的地位日益凸顯。對于倡導(dǎo)技術(shù)主權(quán)的歐洲來說,推動本土AI技術(shù)的發(fā)展,減少對美國的依賴,或許才是歐洲AI可持續(xù)發(fā)展的關(guān)鍵。

責(zé)任編輯:常麗君

抱歉,您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式,這會影響您正常瀏覽本網(wǎng)頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標(biāo)升級或更換您的瀏覽器

3.暫不升級,繼續(xù)瀏覽

繼續(xù)瀏覽