28日,DeepSeek官方宣布DeepSeek R1模型已完成小版本試升級(jí),歡迎前往官方網(wǎng)頁、APP、小程序測(cè)試(打開深度思考),API 接口和使用方式保持不變。
據(jù)了解,根據(jù)DeepSeek內(nèi)部優(yōu)化方向和自身的感知,這次升級(jí)主要集中在以下幾個(gè)方面:
* 響應(yīng)質(zhì)量優(yōu)化:復(fù)雜推理、多步驟計(jì)算更準(zhǔn)確;長文理解與生成更連貫、邏輯更清晰;數(shù)學(xué)、編程等專業(yè)性輸出更可靠。
* 響應(yīng)速度小幅提升:在網(wǎng)頁端、App、API 接口中響應(yīng)更敏捷;尤其在處理超長文本輸入時(shí),延遲有所降低(約提升 10%~20%)。
* 對(duì)話穩(wěn)定性增強(qiáng):上下文記憶更穩(wěn)定,尤其在超長對(duì)話中(支持最多128K上下文);減少偶爾“遺忘設(shè)定”或“跑偏”的情況。
* API 和接口兼容性保持穩(wěn)定:如公告所說:API 調(diào)用方式、參數(shù)、返回結(jié)構(gòu)完全不變;用戶無需調(diào)整現(xiàn)有集成,即可無縫使用新版本。
R2沒有來,但R1升級(jí)了。這是自3月底以來,DeepSeek的一次最新動(dòng)作。今年3月,DeepSeek曾對(duì)V3模型進(jìn)行小版本升級(jí),同樣是通過官方交流群率先宣布,隨后公布了具體更新內(nèi)容。此前,也有許多關(guān)于R2大模型的傳聞出現(xiàn),比如“參數(shù)規(guī)模被曝達(dá)到驚人的1.2萬億,相比前代R1的6710億參數(shù)幾乎翻倍等”。但截至目前,并未獲得官方證實(shí)。
這家總部位于杭州的初創(chuàng)公司今年1月發(fā)布了DeepSeek-R1人工智能模型,震驚了全球科技界。R1模型在多項(xiàng)標(biāo)準(zhǔn)化指標(biāo)上的表現(xiàn)均優(yōu)于西方競(jìng)爭對(duì)手,而其成本據(jù)稱僅為數(shù)百萬美元。此舉引發(fā)了全球科技股的暴跌,投資者開始質(zhì)疑,領(lǐng)先的公司是否仍需要投入巨資來構(gòu)建人工智能服務(wù)。
據(jù)用戶反饋,DeepSeek升級(jí)后的模型,思維鏈 (CoT) 的行為似乎發(fā)生了顯著變化。
也有用戶總結(jié)了更新后的幾個(gè)亮點(diǎn),其中包括:現(xiàn)在像Google模型一樣進(jìn)行深度推理;改進(jìn)寫作任務(wù)——更自然、格式更好;獨(dú)特的推理風(fēng)格——不僅快速,而且深思熟慮;長時(shí)間思考——每個(gè)任務(wù)最多30-60分鐘。