国产成人无码免费一区二区三区 ,中文字幕日韩精品亚洲七区,福利一区二区视频在线

智東西（公眾號：zhidxcom）
作者 | 陳駿達(dá)
編輯 | 李水青

谷歌干崩內(nèi)存股的論文，竟被曝出學(xué)術(shù)不端？

智東西3月29日報道，近日，谷歌的TurboQuant論文引發(fā)全網(wǎng)廣泛關(guān)注。該論文提出的TurboQuant技術(shù)，據(jù)說能將大模型KV緩存的內(nèi)存占用壓縮至原來的1/6，似乎給當(dāng)下的“AI存儲荒”提供了解決思路，因此一度引發(fā)美股多支存儲股大跌，市值合計蒸發(fā)超過900億美元（約合人民幣6220億元）。

然而，反轉(zhuǎn)也來得很快。3月27日，蘇黎世聯(lián)邦理工學(xué)院計算機(jī)博士后、RaBitQ論文作者華人高健揚(yáng)發(fā)布文章，指出谷歌的TurboQuant論文存在三大問題：系統(tǒng)性地回避了其與已有RaBitQ方法（2024年發(fā)布）的相似性，錯誤描述了RaBitQ的理論結(jié)果，并刻意營造不公的實驗環(huán)境。

干崩存儲股的谷歌爆紅論文塌房！被曝抄襲、貶低華人學(xué)者成果，谷歌回應(yīng)：晚點(diǎn)改

▲高健揚(yáng)在知乎上發(fā)表的澄清文章

并且，谷歌TurboQuant團(tuán)隊可能還存在“知錯不改”的嫌疑。高健揚(yáng)稱，早在2025年5月，在TurboQuant論文正式投稿至ICLR 2026之前，RaBitQ團(tuán)隊已經(jīng)向作者指出了論文存在的問題，TurboQuant團(tuán)隊承認(rèn)了相關(guān)問題，但選擇不予修復(fù)。

干崩存儲股的谷歌爆紅論文塌房！被曝抄襲、貶低華人學(xué)者成果，谷歌回應(yīng)：晚點(diǎn)改

▲高健揚(yáng)在X平臺上發(fā)表的推文

今天下午，高健揚(yáng)更新了知乎帖子，稱他們僅收到TurboQuant論文第一作者Amir Zandieh的籠統(tǒng)答復(fù)，承諾會修正對RaBitQ理論結(jié)果的錯誤描述和實驗環(huán)境差異，但拒絕在文中討論TurboQuant與RaBitQ在技術(shù)上的相似性。

并且，TurboQuant團(tuán)隊僅愿意在今年4月ICLR 2026正式會議結(jié)束之后才做相應(yīng)修正。

高健揚(yáng)稱，他決定此時公開說明這一事件，是因為錯誤的學(xué)術(shù)敘事一旦廣泛傳播，糾正的成本會越來越高。

高健揚(yáng)在知乎上發(fā)布的公開澄清文章：

https://zhuanlan.zhihu.com/p/2020969476166808284?wechatShare=1&s_r=0

一、KV緩存砍至1/6、推理提速8倍，TurboQuant具體做了什么？

在厘清事實之前，我們需要首先看看谷歌的TurboQuant究竟提出了什么方法。

向量量化一直是AI數(shù)據(jù)“瘦身”的主流技術(shù)，主要用于壓縮高維向量、節(jié)省內(nèi)存、提升檢索與推理效率。但傳統(tǒng)壓縮方法通常會引入額外的內(nèi)存開銷，反而會影響向量量化的效果。

谷歌提出的TurboQuant是一種無損極限壓縮算法，該算法主要通過兩個關(guān)鍵步驟，在實現(xiàn)零精度損失的同時大幅縮小模型尺寸。

干崩存儲股的谷歌爆紅論文塌房！被曝抄襲、貶低華人學(xué)者成果，谷歌回應(yīng)：晚點(diǎn)改

▲TurboQuant博客

第一步是高質(zhì)量壓縮（PolarQuant方法）。TurboQuant首先對數(shù)據(jù)向量進(jìn)行隨機(jī)旋轉(zhuǎn)。這一操作能夠簡化數(shù)據(jù)的幾何結(jié)構(gòu)，從而便于使用標(biāo)準(zhǔn)且高質(zhì)量的模型量化器。

通過這一階段，TurboQuant能夠?qū)⒋蟛糠謮嚎s能力（即多數(shù)比特）用于捕捉原始向量的主要特征和強(qiáng)度。

第二步是消除隱藏誤差。TurboQuant僅用少量剩余壓縮能力（僅1比特），對第一階段殘留的微小誤差應(yīng)用QJL算法。QJL階段相當(dāng)于一個數(shù)學(xué)誤差檢查器，能夠消除偏差，從而獲得更加精準(zhǔn)的注意力評分。

QJL采用一種了稱為“Johnson-Lindenstrauss變換”的方法，縮小復(fù)雜、高維數(shù)據(jù)，同時保持?jǐn)?shù)據(jù)點(diǎn)之間的基本距離和關(guān)系。

實驗中，谷歌稱TurboQuant在所有基準(zhǔn)測試中均達(dá)到了“完美的下游任務(wù)表現(xiàn)”，同時將KV緩存的內(nèi)存占用減至1/6。

干崩存儲股的谷歌爆紅論文塌房！被曝抄襲、貶低華人學(xué)者成果，谷歌回應(yīng)：晚點(diǎn)改

▲TurboQuant基準(zhǔn)測試結(jié)果

使用TurboQuant計算注意力邏輯值后，在H100 GPU加速器上，4比特TurboQuant相比32比特未量化的鍵值實現(xiàn)了高達(dá)8倍的性能提升。

干崩存儲股的谷歌爆紅論文塌房！被曝抄襲、貶低華人學(xué)者成果，谷歌回應(yīng)：晚點(diǎn)改

▲TurboQuant性能測試結(jié)果

二、RaBitQ論文作者完整復(fù)盤：去年就已提出質(zhì)疑，TurboQuant團(tuán)隊不回郵件

TurboQuant論文在3月25日被“Google Research”官方賬號轉(zhuǎn)發(fā)后，獲得了海量關(guān)注。然而，這篇論文與2024年5月由高健揚(yáng)等人發(fā)布RaBitQ論文，有不少說不清道不明的聯(lián)系。

高健揚(yáng)在他發(fā)布的知乎帖子中回顧了相關(guān)爭議的完整時間線：

干崩存儲股的谷歌爆紅論文塌房！被曝抄襲、貶低華人學(xué)者成果，谷歌回應(yīng)：晚點(diǎn)改

▲高健揚(yáng)回顧事件完整時間線

可以看到，在2024年，RaBitQ團(tuán)隊就陸續(xù)發(fā)布了論文的預(yù)印本和擴(kuò)展版，同時開源了相關(guān)代碼。這篇論文還發(fā)表在頂級會議SIGMOD上。

2025年1月，TurboQuant論文第二作者M(jìn)ajid Daliri與RaBitQ團(tuán)隊取得聯(lián)系，請求協(xié)助調(diào)試Python版RaBitQ實現(xiàn)，三個月后TurboQuant論文在arXiv發(fā)布。

TurboQuant發(fā)布后，RaBitQ團(tuán)隊很快發(fā)現(xiàn)了TurboQuant團(tuán)隊針對RaBitQ采用了不同的實驗條件，然而TurboQuant團(tuán)隊在被要求修改事實性錯誤后，采取了消極態(tài)度，停止回復(fù)郵件。

2025年11月，TurboQuant論文被提交至ICLR 2026，相關(guān)錯誤并未修改，RaBitQ團(tuán)隊聯(lián)系ICLR 2026后也未獲得回應(yīng)。

在高健揚(yáng)看來，TurboQuant論文至少存在三個問題。

問題一：系統(tǒng)性地回避TurboQuant方法與已有RaBitQ方法的相似性

RaBitQ與TurboQuant在方法層面有直接的結(jié)構(gòu)聯(lián)系，兩者都在量化前對輸入向量施加隨機(jī)旋轉(zhuǎn)（Johnson-Lindenstrauss變換）。這是兩篇論文方法設(shè)計中最核心、最接近的部分。

對于這一質(zhì)疑，TurboQuant團(tuán)隊曾回復(fù)道：“隨機(jī)旋轉(zhuǎn)和Johnson-Lindenstrauss變換已成為該領(lǐng)域的標(biāo)準(zhǔn)技術(shù)，我們無法列舉所有使用這些方法的方法?！?/p>

高健揚(yáng)認(rèn)為這一回應(yīng)是在轉(zhuǎn)移矛盾：作為在相同問題設(shè)定下，率先將隨機(jī)旋轉(zhuǎn)（Johnson-Lindenstrauss變換）與向量量化結(jié)合、并建立最優(yōu)理論保證的先行工作，RaBitQ應(yīng)當(dāng)在文中被準(zhǔn)確描述，其與TurboQuant方法的聯(lián)系應(yīng)當(dāng)充分討論。

問題二：錯誤描述RaBitQ的理論結(jié)果

高健揚(yáng)稱，TurboQuant論文在不提供任何論據(jù)的情況下，將RaBitQ的理論保證定性為“次優(yōu)”，將原因歸結(jié)為“較粗糙的分析（loose analysis）”。

然而，RaBitQ的誤差界實際上已經(jīng)達(dá)到了理論計算機(jī)頂級會議論文（Alon-Klartag，F(xiàn)OCS 2017）給出的漸近最優(yōu)誤差界，并因這一結(jié)果被邀請至理論計算機(jī)科學(xué)頂級會議FOCS的Workshop進(jìn)行報告。

2025年，RaBitQ團(tuán)隊與TurboQuant的第二作者M(jìn)ajid Daliri進(jìn)行了多輪詳細(xì)的郵件技術(shù)討論，澄清TurboQuant團(tuán)隊對RaBitQ理論結(jié)果的錯誤解讀，然而相關(guān)錯誤定性一直未被修正。

問題三：刻意創(chuàng)造不公平的實驗環(huán)境

TurboQuant團(tuán)隊在測試RaBitQ和TurboQuant時采用了不同的實驗設(shè)置。

具體來看，TurboQuant團(tuán)隊使用單核CPU、關(guān)閉多線程并行的設(shè)置來測試RaBitQ算法，但卻使用英偉達(dá)A100 GPU測試TurboQuant算法。

TurboQuant團(tuán)隊還使用了自己翻譯的Python代碼，而非RaBitQ團(tuán)隊開源的C++實現(xiàn)，前者的效果要差于后者。

同時，以上兩點(diǎn)差異均未在論文中充分披露。

三、論文評審發(fā)帖：只提一次RaBitQ，我是震驚的

RaBitQ團(tuán)隊的維權(quán)，獲得了一些網(wǎng)友和學(xué)術(shù)圈人士的聲援。

TurboQuant論文的一位評審者在公開的學(xué)術(shù)論文評審平臺OpenReview發(fā)表評論，稱他雖然認(rèn)為TurboQuant的理論分析和實驗結(jié)果都很出色，但是也發(fā)現(xiàn)這一方法與RaBitQ存在明顯的共通之處，并要求TurboQuant團(tuán)隊比較兩者在設(shè)計上的差異如何影響性能。

然而，在查看TurboQuant的最終版本時，他驚訝地發(fā)現(xiàn)在論文的實驗部分RaBitQ僅被提到了一次。

干崩存儲股的谷歌爆紅論文塌房！被曝抄襲、貶低華人學(xué)者成果，谷歌回應(yīng)：晚點(diǎn)改

▲TurboQuant論文評審談這篇論文的問題

在知乎上，有位網(wǎng)友稱自己去年讀TurboQuant論文時，就感受到其與RaBitQ的相似之處，更像是把RaBitQ換了一種表達(dá)方式，在GPU上實現(xiàn)一遍，創(chuàng)新性不夠。

干崩存儲股的谷歌爆紅論文塌房！被曝抄襲、貶低華人學(xué)者成果，谷歌回應(yīng)：晚點(diǎn)改

▲知乎網(wǎng)友評論TurboQuant創(chuàng)新性問題

還有網(wǎng)友稱，自己復(fù)現(xiàn)了TurboQuant，發(fā)現(xiàn)至少在向量檢索領(lǐng)域TurboQuant的召回率低于RaBitQ。

干崩存儲股的谷歌爆紅論文塌房！被曝抄襲、貶低華人學(xué)者成果，谷歌回應(yīng)：晚點(diǎn)改

▲知乎網(wǎng)友質(zhì)疑TurboQuant復(fù)現(xiàn)結(jié)果

X平臺上，有網(wǎng)友評價道，在論文提交前問題就被指出，但卻被忽略，這是最糟糕的結(jié)果。這意味著TurboQuant團(tuán)隊明明意識到問題存在卻故意保留了下來。雖然同行評審流程應(yīng)該能發(fā)現(xiàn)這些問題，但I(xiàn)CLR的接收并不總是意味著技術(shù)論斷站得住腳。

干崩存儲股的谷歌爆紅論文塌房！被曝抄襲、貶低華人學(xué)者成果，谷歌回應(yīng)：晚點(diǎn)改

▲X平臺網(wǎng)友評價TurboQuant涉嫌學(xué)術(shù)不端事件

結(jié)語：頂會論文、大廠標(biāo)簽不是護(hù)身符，學(xué)術(shù)敘事不容“帶病傳播”

截至目前，TurboQuant與RaBitQ之間的爭議尚未有官方定論。然而，學(xué)術(shù)研究的核心在于“可追溯”與“可復(fù)現(xiàn)”。當(dāng)一篇論文被頂級會議接收，并通過大型科技公司的渠道獲得千萬級曝光時，其技術(shù)敘事的影響力已遠(yuǎn)超學(xué)術(shù)圈本身，甚至波及資本市場。

在這種情況下，對先行工作的準(zhǔn)確引用、對實驗條件的完整披露、對質(zhì)疑的及時回應(yīng)，便不再是可有可無的環(huán)節(jié)，而是維護(hù)學(xué)術(shù)共同體公信力的基本責(zé)任。

目前，RaBitQ論文團(tuán)隊已向ICLR官方再次提交正式投訴和完整證據(jù)包。未來，他們還考慮在arXiv上發(fā)布詳細(xì)技術(shù)報告，進(jìn)一步呈現(xiàn)兩項研究的關(guān)系。

無論結(jié)果如何，它都再次提醒我們，對學(xué)術(shù)規(guī)范的敬畏、對先行者的尊重，以及對每一份實驗數(shù)據(jù)的誠實，始終是不可逾越的底線。

欧美精品一区二区三区观看,欧美精品一区二区三区观看,日本五十路和六十路的区别,爽爽无码18禁免费国产,色av性av丰满av,深爱五月天深爱开心激情网,欧美日韩极品视频在线播放,91 亚洲视频在线观看,在线你懂的视频在线

一、KV緩存砍至1/6、推理提速8倍，TurboQuant具體做了什么？

二、RaBitQ論文作者完整復(fù)盤：去年就已提出質(zhì)疑，TurboQuant團(tuán)隊不回郵件

三、論文評審發(fā)帖：只提一次RaBitQ，我是震驚的

結(jié)語：頂會論文、大廠標(biāo)簽不是護(hù)身符，學(xué)術(shù)敘事不容“帶病傳播”

相關(guān)推薦

欧美精品一区二区三区观看,欧美精品一区二区三区观看,日本五十路和六十路的区别,爽爽无码18禁免费国产,色av性av丰满av,深爱五月天深爱开心激情网,欧美日韩极品视频在线播放,91 亚洲视频在线观看,在线你懂的视频在线

一、KV緩存砍至1/6、推理提速8倍，TurboQuant具體做了什么？

二、RaBitQ論文作者完整復(fù)盤：去年就已提出質(zhì)疑，TurboQuant團(tuán)隊不回郵件

三、論文評審發(fā)帖：只提一次RaBitQ，我是震驚的

結(jié)語：頂會論文、大廠標(biāo)簽不是護(hù)身符，學(xué)術(shù)敘事不容“帶病傳播”

相關(guān)推薦

一、KV緩存砍至1/6、推理提速8倍，TurboQuant具體做了什么？

二、RaBitQ論文作者完整復(fù)盤：去年就已提出質(zhì)疑，TurboQuant團(tuán)隊不回郵件

三、論文評審發(fā)帖：只提一次RaBitQ，我是震驚的

結(jié)語：頂會論文、大廠標(biāo)簽不是護(hù)身符，學(xué)術(shù)敘事不容“帶病傳播”