DeepSeek-V3性能優(yōu)越且成本較低，中國大模型助力AI技術(shù)更開放更高效

2025-01-16 01:35:00 來源: 科技日報點擊數(shù)：

科技日報記者李山

近日，中國初創(chuàng)企業(yè)DeepSeek開發(fā)的大語言模型（LLM）DeepSeek-V3引發(fā)美歐業(yè)界廣泛關(guān)注，該模型在技術(shù)性能、開源模式、成本效益等方面的突出表現(xiàn)獲得積極評價。開源的DeepSeek-V3是全球AI生態(tài)的一次重要變革，有助于美國之外的國家和地區(qū)在AI領(lǐng)域自主發(fā)展，推動全球AI技術(shù)向更加開放、多元和高效的方向邁進。

多項指標(biāo)媲美頂尖模型

根據(jù)測評機構(gòu)Artificial Analysis的獨立分析，DeepSeek-V3可與世界頂尖的AI模型競爭。在文本理解、編碼、數(shù)學(xué)和學(xué)科知識方面，DeepSeek-V3優(yōu)于Meta的Llama 3.1-405B和阿里巴巴的Qwen 2.5-72B等開源模型，并在性能上和世界頂尖的閉源模型OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet不分伯仲。DeepSeek-V3在中文處理、編碼和數(shù)學(xué)計算等方面的優(yōu)勢，使其在教育和科研領(lǐng)域具有巨大潛力。

DeepSeek-V3的開發(fā)和訓(xùn)練成本也明顯低于其他大模型。OpenAI創(chuàng)始成員之一安德烈·卡帕蒂強調(diào)了這種非凡的效率：像DeepSeek-V3這樣性能和級別的模型，通常需要1.6萬到10萬個GPU的集群來訓(xùn)練，而中國初創(chuàng)公司僅用了2048個GPU在57天內(nèi)便完成了訓(xùn)練。其成本約557.6萬美元，僅為其他主流模型（如GPT-4）的1/10左右。

另一方面，媒體則關(guān)注了所謂的“AI污染”、隱私保護和安全等問題。隨著互聯(lián)網(wǎng)上AI生成內(nèi)容的泛濫，AI模型在訓(xùn)練過程中會產(chǎn)生“幻覺”或誤導(dǎo)性答案。DeepSeek-V3的案例凸顯了在AI生成內(nèi)容日益普及的背景下，如何確保訓(xùn)練數(shù)據(jù)的純凈性和可靠性是個亟待解決的問題。

開源策略改變AI生態(tài)

DeepSeek之所以能實現(xiàn)巨大的效率提升，關(guān)鍵在于其算法、框架和硬件的協(xié)同設(shè)計。在美國企業(yè)AI模型的開發(fā)費用越來越昂貴之際，DeepSeek-V3的出現(xiàn)表明，即使沒有數(shù)十億美元的預(yù)算，也能開發(fā)出頂級AI。這對預(yù)算有限的企業(yè)和研究機構(gòu)來說是個好消息。這種高效訓(xùn)練方法被媒體稱為“AI領(lǐng)域的范式轉(zhuǎn)變”，這在當(dāng)前算力緊張的背景下尤為重要。

此外，DeepSeek-V3的開源策略也受到業(yè)界熱烈歡迎。像OpenAI這樣擁有大量用戶的公司收費高、不開源，卻仍然虧損數(shù)十億美元；而DeepSeek-V3以更便宜的價格提供頂級模型，而且還是開源的。這樣低的開發(fā)成本和激進的定價政策，讓很多AI企業(yè)倍感壓力。長遠看，這將沖擊到美國科技巨頭在AI市場的主導(dǎo)地位。

DeepSeek-V3證明了開源模型在性能和成本上已具備與閉源模型競爭的能力。這將促使更多企業(yè)重新評估其技術(shù)策略，尤其是在開源與閉源模式、硬件依賴與軟件創(chuàng)新之間的平衡。這有助于推動AI生態(tài)向更加開放的方向發(fā)展，促使更多企業(yè)加入開源陣營，為全球AI社區(qū)提供寶貴的資源，進而促進AI技術(shù)的普及。

突破“小院高墻”式封鎖

近年來，中美之間圍繞AI進行了激烈競爭。美國試圖通過日趨嚴(yán)苛的芯片出口禁令來限制中國AI的發(fā)展。1月13日，美國又推出新一輪AI芯片出口限制措施，希望將AI技術(shù)的發(fā)展集中在所謂的“友好國家和地區(qū)”，防止先進芯片流入“對手”國，并為全球AI發(fā)展設(shè)定美國標(biāo)準(zhǔn)。美國相關(guān)政策的制定者想當(dāng)然地認(rèn)為，除了美國以外沒有國家可提供高端GPU芯片及相應(yīng)算力，或是研發(fā)出替代算法和產(chǎn)品。然而，DeepSeek-V3的出現(xiàn)證明，美國“小院高墻”式的封鎖終將被技術(shù)創(chuàng)新所擊潰。

事實證明，美國的各種限制措施反而催生了中國在算法和架構(gòu)上的創(chuàng)新。中國的芯片技術(shù)在一步步提高，AI應(yīng)用領(lǐng)域的創(chuàng)新更是取得了明顯進步。DeepSeek-V3為中國AI生態(tài)的發(fā)展提供了新動力，也有利于全球AI技術(shù)向更加開放、多元和高效的方向邁進。

反觀歐洲，雖然各國政府高度重視AI技術(shù)和產(chǎn)業(yè)發(fā)展，但歐洲在AI發(fā)展過程中過于依賴美國大型科技公司的投資和技術(shù)支持，導(dǎo)致技術(shù)主權(quán)和市場競爭力被削弱。AI在推動新一輪科技革命和產(chǎn)業(yè)變革中的地位日益凸顯。對于倡導(dǎo)技術(shù)主權(quán)的歐洲來說，推動本土AI技術(shù)的發(fā)展，減少對美國的依賴，或許才是歐洲AI可持續(xù)發(fā)展的關(guān)鍵。

責(zé)任編輯：常麗君

DeepSeek-V3性能優(yōu)越且成本較低，中國大模型助力AI技術(shù)更開放更高效

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網(wǎng)頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標(biāo)升級或更換您的瀏覽器

3.暫不升級，繼續(xù)瀏覽

DeepSeek-V3性能優(yōu)越且成本較低，中國大模型助力AI技術(shù)更開放更高效

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網(wǎng)頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標(biāo)升級或更換您的瀏覽器

3.暫不升級，繼續(xù)瀏覽

DeepSeek-V3性能優(yōu)越且成本較低，中國大模型助力AI技術(shù)更開放更高效

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網(wǎng)頁