1月26日,DeepSeek在美區(qū)蘋(píng)果App Store免費(fèi)榜升至第六位,超越Google Gemini、Microsoft Copilot等美國(guó)科技公司的生成式AI產(chǎn)品。同日,DeepSeek出現(xiàn)了短時(shí)閃崩現(xiàn)象。不少網(wǎng)友反映,使用時(shí)遇到 “服務(wù)器繁忙” 的提示。對(duì)此,DeepSeek回應(yīng)稱(chēng),當(dāng)天下午確實(shí)出現(xiàn)了局部服務(wù)波動(dòng),但問(wèn)題在數(shù)分鐘內(nèi)就得到了解決。此次事件可能是由于新模型發(fā)布后,用戶(hù)訪問(wèn)量激增,服務(wù)器一時(shí)無(wú)法滿(mǎn)足大量用戶(hù)的并發(fā)需求。不過(guò),官方狀態(tài)頁(yè)并未將這一事件標(biāo)記為事故。
【機(jī)會(huì)前瞻】
近日,由量化私募巨頭幻方量化創(chuàng)立的人工智能公司DeepSeek再次成為人工智能行業(yè)的焦點(diǎn)。自2023年7月成立以來(lái),DeepSeek在大模型領(lǐng)域持續(xù)發(fā)力,推出多款開(kāi)源模型,在全球AI市場(chǎng)掀起波瀾。
1月26日,DeepSeek在美區(qū)蘋(píng)果App Store免費(fèi)榜升至第六位,超越Google Gemini、Microsoft Copilot等美國(guó)科技公司的生成式AI產(chǎn)品。同日,DeepSeek出現(xiàn)了短時(shí)閃崩現(xiàn)象。不少網(wǎng)友反映,使用時(shí)遇到 “服務(wù)器繁忙” 的提示。對(duì)此,DeepSeek回應(yīng)稱(chēng),當(dāng)天下午確實(shí)出現(xiàn)了局部服務(wù)波動(dòng),但問(wèn)題在數(shù)分鐘內(nèi)就得到了解決。此次事件可能是由于新模型發(fā)布后,用戶(hù)訪問(wèn)量激增,服務(wù)器一時(shí)無(wú)法滿(mǎn)足大量用戶(hù)的并發(fā)需求。
2023年11月2日,DeepSeek發(fā)布首個(gè)開(kāi)源代碼大模型DeepSeek Coder,支持多種編程語(yǔ)言的代碼生成、調(diào)試和數(shù)據(jù)分析任務(wù)。
2024年5月7日,DeepSeek發(fā)布第二代開(kāi)源混合專(zhuān)家(MoE)模型 DeepSeek-V2,總參數(shù)達(dá)2360億,推理成本大幅降低,降至每百萬(wàn)token僅1元人民幣,在降本方面展現(xiàn)出強(qiáng)大競(jìng)爭(zhēng)力,被業(yè)內(nèi)稱(chēng)為 “AI 界的拼多多”。
2024年12月26日,DeepSeek-V3發(fā)布,總參數(shù)達(dá)6710億。該模型采用創(chuàng)新的MoE架構(gòu)和FP8混合精度訓(xùn)練,訓(xùn)練成本僅為557.6萬(wàn)美元,遠(yuǎn)低于通常用于預(yù)訓(xùn)練大語(yǔ)言模型的上億美元成本。在性能表現(xiàn)上,DeepSeek-V3在知識(shí)類(lèi)任務(wù)、算法類(lèi)代碼場(chǎng)景、工程類(lèi)代碼場(chǎng)景、中文能力、數(shù)學(xué)能力等方面優(yōu)勢(shì)顯著,在多語(yǔ)言編程測(cè)試排行榜中,超越Anthropic的Claude 3.5 Sonnet大模型,僅次于OpenAI o1大模型,在聊天機(jī)器人競(jìng)技場(chǎng)(Chatbot Arena)上排名第七,開(kāi)源模型中位居第一。
2025年1月20日,DeepSeek發(fā)布新一代推理模型DeepSeek-R1并開(kāi)源,性能與OpenAI的o1正式版持平。僅僅六天后,1月26日,DeepSeek登頂美區(qū)App Store免費(fèi)榜第六,超越谷歌Gemini和微軟Copilot等產(chǎn)品,其影響力迅速在全球范圍內(nèi)蔓延。