久久av免费看,日本久久二区,久久国产精品色av免费看,波多视频一区

首頁 > 原創知識 > 原創知識 > 解析梁文鋒署名DeepSeek新論文:讓記憶和計算分開

解析梁文鋒署名DeepSeek新論文:讓記憶和計算分開

發布時間:2026-01-15 11:34:20 來源: 18638159832

1月12日晚間,DeepSeek發布梁文鋒署名的新論文,主題為《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》(直譯為基于可擴展查找的條件記憶:大語言模型稀疏性的新維度),這也是2026開年至今,DeepSeek團隊的第二篇重磅論文。

 

此前,在1月1日發布的論文中,DeepSeek提出一種名為“mHC”(直譯為“流形約束超連接”)的框架,可以有效解決大模型訓練中的穩定性問題。而在本次發布的論文中,DeepSeek聯合北京大學提出了“條件記憶”這一概念,直指當前大語言模型基礎架構Transformer在知識檢索方面存在的低效和算力消耗問題。

 

在這篇論文里,DeepSeek通過創新的Engram(直譯為:記憶痕跡)架構為模型規模化擴展提供了新的技術路徑,若以簡單的比喻來理解,就是DeepSeek設計了一種新架構,將大模型的“條件記憶”和“計算”分開,最終達到了降低錯誤、節省算力的目的。

 

預印本網站上DeepSeek的論文頁面截圖,紅框為梁文鋒名字。

 

大模型“痛點”:簡單問題需要復雜推理,容易“遺忘”

 

許多AI大模型用戶均曾在使用過程中發現過一個現象:AI會偶爾“忘記”自己曾經說過的話。對于這一問題,有AI聊天重度用戶曾對記者表示,可以通過再次“提醒”的方式來讓AI重復記起,ChatGPT等應用也對此進行過設置,讓用戶可以保存一些較為重要的信息到“長期記憶”中。

 

然而,這一切只能“治標”不能“治本”。究其原因,根據美國約翰斯·霍普金斯大學和中國人民大學的研究團隊2025年3月發布的論文《大型語言模型不具備類人工作記憶》(LLMs Do Not Have Human-Like Working Memory),大語言模型所依賴的“上下文窗口”與工作記憶存在本質區別。

 

根據研究人員測試,模型在處理超過5輪的多步驟邏輯推理任務時,會出現關鍵信息丟失的現象,在長文本生成場景下,前文設定的人物關系、情節線索極易發生偏差。

 

在實際應用中,這一缺陷有可能被無限放大。如在企業客服場景,模型無法長期記住用戶的個性化需求;在醫療問診場景,患者此前提及的病史、用藥禁忌可能被忽略;在代碼生成場景,跨文件的函數調用邏輯易出現混亂。可以說,記憶短板已成為大模型從 “通用工具” 邁向 “垂直領域專用系統” 的最大障礙。

 

究其原因,在多輪對話中,早期輸入的關鍵信息會隨著對話輪次增加而逐漸衰減,最終被新信息覆蓋。這種 “答后忘前”的現象,本質是模型的短時記憶無法有效轉化為長期可用的知識。另一方面,密集型注意力計算模式下,記憶存儲與邏輯推理共享算力資源,二者存在天然的資源競爭關系 —— 模型難以同時兼顧 “記住更多信息” 與 “精準完成推理”。

 

這一背景下,DeepSeek則保持了一貫的“省錢”作風,看到了這之中存在的算力消耗問題。梁文鋒署名的新論文表示,語言建模本質上包含兩類子任務:一類是組合式推理,需要依賴深層、動態計算完成;另一類是知識檢索,面向命名實體等相對靜態的內容,理論上可以通過簡單查找更高效地處理。然而,現有Transformer架構缺乏原生的查找組件,遇到這類靜態信息時往往仍要反復調用深層網絡進行重建,從而加劇算力浪費并推高推理成本。

 

DeepSeek在論文中指出,當前主流模型在內部運行方式上仍存在明顯低效。大量固定知識和常見語言模式并不需要復雜推理,但模型在推理時往往仍要通過多層計算重新構建相關信息,導致算力被大量消耗在記憶相關操作上。在長文本和知識密集型任務中,這一問題更為突出,重復靜態信息的重建會增加額外的推理開銷并拉長推理鏈路。

 

首創MoE+Engram雙稀疏軸架構,實現“推理+檢索”分工協作

 

那么,如何解決上述問題呢?

 

根據DeepSeek的論文,研究人員首次將條件記憶(Conditional Memory)作為混合專家模型(MoE)條件計算的互補維度,提出計算與記憶雙稀疏軸的設計思路,這也是此次研究的核心創新點。

 

所謂“條件記憶”,是指模型能夠基于輸入中的局部上下文模式,以常數時間從大規模參數化記憶中檢索并融合靜態知識表示,從而避免在推理過程中反復通過深層計算重建高頻、模板化信息,類似于人類在面對熟悉知識時直接調用既有記憶,而非重新推導。

 

Engram架構示意圖 來源:DeepSeek論文截圖

 

具體而言,條件記憶通過Engram模塊(記憶痕跡)實現靜態知識存儲與動態計算的分離,達成靜態模式的常數時間O(1)查找。其核心邏輯是為語言建模的兩類子任務進行分工:MoE專注處理需要深層思考的組合式推理任務,Engram則依托條件記憶機制負責靜態知識的快速檢索,從架構上優化了算力資源分配,改變了傳統模型用計算模擬記憶的低效模式。當大約20%至25%的稀疏參數預算分配給Engram,剩余部分留給MoE時(75% -80%),模型性能達到最佳。

 

這種稀疏性設計帶來兩大優勢:一是大幅降低算力消耗,靜默狀態的記憶資源不占用計算資源,提升模型運行效率;二是拓展記憶容量,稀疏存儲模式可支持更大規模的知識存入,突破傳統注意力窗口的物理限制。

 

論文給出了這一新方案在準確性上所得到的提升:在長上下文檢索方面,研究人員采用業內公認的兩個長上下文評測基準。實驗結果顯示,在32k上下文長度下,Engram-27B 在多項 Needle-in-a-Haystack(NIAH)任務中顯著優于MoE基線模型,Multi-Query NIAH的準確率從 84.2%提升至97.0%,Variable Tracking從77.0%提升至89.0%。

 

目前,該研究的代碼已開源,DeepSeek團隊在論文最后表示,“我們認為條件記憶函數是下一代稀疏模型中不可或缺的建模基元。”這一表述的背后,是行業對大模型技術演進方向的共識——當參數競賽進入瓶頸期,稀疏性設計將成為提升模型效率與能力的核心路徑,而條件記憶或許可以成為稀疏模型在記憶領域的關鍵突破。

 

在業界猜測DeepSeek下一代模型將于春節前發布的背景下,這篇論文的出現頗具風向標意義,論文提出的技術范式也為大模型的底層架構創新提供了新的思路。

原創知識更多>>

比亞迪海豹07 EV官圖!前臉生動,全新紫色,軸距2900mm定位中型車 前途陸群造車往事:拿著舊船票,找不到新大陸 全新阿爾法S5預售11.28萬起:重新審視年輕人的第一臺轎跑 駕駛BMW iX M70的體驗,竟然能秒殺大部分跑車 三駕馬車齊發力!車市淡季逆勢走強,吉利2月銷量再超20萬 車市承壓 奕派科技逆勢增長 前兩月同比增37% 2月新勢力銷量點評:悲喜并不相通,分化仍是主旋律 2026年從整車業務朝著自動駕駛、無人駕駛出租車、人形機器人等板塊瘋狂傾斜 過年開什么新能源車回家,親戚最不會問? 中東實測翻車,Robotaxi還是有點傻? 大眾Atlas換代在即,設計更新、主打七座SUV市場 無差別普惠 全維度守護 東風風行點亮返鄉路 眾泰的“重啟鍵”,這次真的按下去了嗎? 上汽大眾2026年“七箭齊發”,開啟“大眾更出眾”新篇章 趙明上車,印奇掌舵:千里科技的想象力,又被刷新了? 新起點 新征程 東風汽車奏響躍遷發展強音 特斯拉Cybercab或配備物理充電接口與攝像頭清洗系統 法雷奧斬獲高端汽車制造商車內照明訂單 華為乾崑科技旗艦大六座 寶駿華境S更多信息 外資Tier1廠商內部人士的直言,道破了不少外資零部件企業在華的生存窘境 特斯拉Model Y Juniper尾燈設計引爭議 因反光式布局致車主被警方攔停 合資車的2026:大反攻,還是大潰敗? 從關稅戰到價格承諾,中歐新能源合作開新局? 賦能千行百業|8.68萬元起,鄭州日產金銳騏榮耀上市 德邦穩盈增長被傳日“吸金”120億:公司回應 產品調整限購 解析梁文鋒署名DeepSeek新論文:讓記憶和計算分開 錨定“三化”戰略航向 中國黃金以硬核實力擘畫黃金產業新藍圖 貴州茅臺披露市場化運營方案,公布自營體系零售價格 年營收僅實現微增,老干媽的“后陶華碧時代”怎么辦? 2025年汽車市場|反“內卷”、闖關L3,十大熱詞看行業進化軌跡
久久av免费看,日本久久二区,久久国产精品色av免费看,波多视频一区
欧美va天堂| 亚洲一区二区免费看| 亚洲综合国产| 亚洲高清成人| 蘑菇福利视频一区播放| 国产精品日韩| 日韩午夜黄色| 亚洲一区激情| 亚洲欧洲免费| 久久精品999| 国产一卡不卡| 国产精品激情| 日韩综合在线| 麻豆精品蜜桃| 黑丝一区二区三区| 日韩一区二区免费看| 国产精品试看| 亚洲一二三区视频| 欧美日韩在线精品一区二区三区激情综合 | 亚洲精品电影| 久久www成人_看片免费不卡| 亚洲小说春色综合另类电影| 欧美日韩亚洲一区在线观看| 九九九精品视频| 国产一区二区三区久久久久久久久| 国产成人精选| 久久亚洲国产| 美女黄网久久| 欧美日韩一区二区三区四区在线观看| 国产精品久久久免费| 成人在线免费观看91| 欧洲av不卡| 亚洲激情社区| 欧美三级第一页| 91麻豆国产自产在线观看亚洲| av中文资源在线资源免费观看| 欧美日韩在线二区| 男女男精品视频网| 欧美aa在线视频| 91亚洲人成网污www| 国产99久久| 日产欧产美韩系列久久99| 久久女人天堂| 国产综合亚洲精品一区二| 日本亚洲最大的色成网站www | 久久国产精品色av免费看| 久久亚州av| 红桃视频欧美| 国产私拍福利精品视频二区| av综合电影网站| 亚洲免费中文| 国产精品丝袜在线播放| 色一区二区三区四区| 中文日韩在线| 国产一区二区精品久| 每日更新成人在线视频| 久久av国产紧身裤| 国产精品三上| 精品国产欧美日韩一区二区三区| 狠狠色狠狠色综合日日tαg| 国产精品久久久久久久久久齐齐| 欧美日韩尤物久久| 日韩av中文字幕一区二区三区| 欧美少妇精品| 日韩精品一区二区三区中文| av亚洲一区二区三区| 日本成人精品| 色欧美自拍视频| 四虎精品一区二区免费| 麻豆精品蜜桃| 国产精品密蕾丝视频下载| 午夜久久美女| 国产在线看片免费视频在线观看| 天堂av在线一区| av中文字幕在线观看第一页 | 在线观看精品| 日韩精品91亚洲二区在线观看| 日韩中文在线播放| 日韩高清二区| 韩日一区二区三区| 国产91欧美| 日本成人一区二区| 亚洲少妇在线| 天堂中文av在线资源库| 国产伦理久久久久久妇女| 91久久视频| 成人午夜国产| 国精品产品一区| 天堂俺去俺来也www久久婷婷| 老牛影视精品| 国产欧美一区二区三区精品观看 | 日本免费一区二区三区四区| 中文一区一区三区免费在线观| 神马日本精品| 麻豆91在线播放| 欧美综合精品| 蜜臀精品久久久久久蜜臀| 久久美女性网| 亚洲精品福利电影| 久久免费福利| 国产精品久久久久久妇女| 亚洲精品黄色| 蜜桃免费网站一区二区三区| 好看的av在线不卡观看| 天堂日韩电影| 中文字幕在线高清| 久久这里只有| 日本午夜精品久久久| 免费在线观看成人| 夜久久久久久| 日韩午夜在线| 伊人久久亚洲影院| 蜜桃成人av| 激情六月综合| 色吊丝一区二区| 久久国产亚洲精品| 欧美天堂视频| 久久久精品日韩| 欧美精品日日操| 88xx成人免费观看视频库| 福利精品在线| 精品一区二区三区免费看| 青青草视频一区| 91成人精品在线| 国产日韩一区二区三区在线| 国产欧美日韩一级| 国产精品网在线观看| 国产精品xxx在线观看| 国产精品久久久久久久久久白浆| 国产欧美高清| 精品视频一区二区三区四区五区| 麻豆精品蜜桃视频网站| 成人午夜在线| 欧美片第1页| 99精品美女| 亚洲黄页一区| 亚洲精品影院在线观看| 中文字幕日韩高清在线| 日韩国产精品久久久| 国产精品一卡| 欧美国产偷国产精品三区| 成人日韩在线| 蜜臀av免费一区二区三区| 夜夜嗨一区二区三区| 视频一区二区中文字幕| 日本国产欧美| 久久99免费视频| 日韩成人精品一区二区| 久久久精品网| 91精品二区| 亚洲欧美专区| 国产精品午夜一区二区三区| 国产精品亚洲人成在99www| 六月丁香综合在线视频| 亚洲精品**中文毛片| 999久久久免费精品国产| 中文一区二区| 91精品视频一区二区| 久久亚洲黄色| 99久久精品网| 亚洲不卡视频| 久久伊人久久| 久久亚洲成人| 亚洲精品自拍| 国产一区一一区高清不卡| 91精品国产自产在线观看永久∴| 伊人久久成人| 亚洲乱码久久| 国产精品**亚洲精品| 97人人精品| 国产亚洲高清视频| 欧美伊人影院| 国产资源在线观看入口av| 免费国产自久久久久三四区久久 | 亚洲最新av| 久久精品资源| 欧美成人综合| 日韩免费精品| 红杏一区二区三区| 欧美成人基地| 视频一区视频二区中文| 国产精品对白久久久久粗| 亚洲黄色网址| 亚洲免费成人av在线| 精品不卡一区| 免费观看久久久4p| 精品视频黄色| 亚洲在线网站| 欧美国产日韩电影| 欧美a级一区| 国产精品色婷婷在线观看| 欧美一区二区三区高清视频| 日本在线成人| 亚洲精品一级二级| 欧美在线看片| 成人台湾亚洲精品一区二区| 国产亚洲福利| 福利一区二区| 日韩有吗在线观看| 91精品啪在线观看国产18|