智東西(公眾號:zhidxcom)
編譯 | 陳佳
編輯 | 程茜

智東西3月26日消息,據(jù)外媒TechCrunch昨日報道,提供訓練后數(shù)據(jù)和評估工作的印度創(chuàng)企Deccan AI完成2500萬美元(約合人民幣1.73億元)A輪融資。Deccan AI成立于2024年10月,在過去一年業(yè)務規(guī)模實現(xiàn)10倍增長,年化營收已達數(shù)千萬美元量級。該公司已服務約10家客戶,客戶名單中包括谷歌DeepMind和云數(shù)據(jù)平臺Snowflake,約80%的收入來自前五大客戶。

Deccan AI的核心定位,是填補前沿AI實驗室自研能力之外的后訓練空白。該公司創(chuàng)始人魯克什·雷迪(Rukesh Reddy)說,后訓練階段對錯誤的容忍度接近于零,任何失誤都會直接影響模型在生產(chǎn)環(huán)境中的表現(xiàn)。這使得后訓練這一環(huán)節(jié)比早期訓練階段更難規(guī)?;?。

本輪融資全部以股權形式完成,由A91 Partners領投,Susquehanna國際集團和普羅斯風投(Prosus Ventures)跟投。

Deccan AI總部位于舊金山灣區(qū),在印度海得拉巴設有大規(guī)模運營團隊,目前員工約125人,背后依托超過百萬名貢獻者組成的任務網(wǎng)絡,每月活躍貢獻者在5000至10000人之間。

Deccan AI創(chuàng)始人Reddy畢業(yè)于印度頂尖院校印度理工學院孟買分校(IIT Bombay),擁有印度管理學院艾哈邁達巴德分校(IIM Ahmedabad)MBA學位,此后在花旗銀行、摩根大通和咨詢公司Monitor Group從事金融和管理咨詢工作超過15年。

幫谷歌DeepMind填補后訓練空白,印度AI創(chuàng)企融資2500萬美元,ARR超數(shù)千萬

▲Deccan AI創(chuàng)始人魯克什·雷迪(Rukesh Reddy)(圖源:Deccan AI)

一、后訓練需求快速外溢,模型落地能力開始依賴外部服務商

包括OpenAI與Anthropic在內的頭部AI實驗室仍將基礎模型訓練牢牢掌握在內部,但圍繞模型落地的大量工作正在向外轉移。從數(shù)據(jù)生成、結果評估到強化學習優(yōu)化,后訓練逐漸從附屬環(huán)節(jié)變?yōu)闆Q定模型可用性的關鍵步驟。隨著企業(yè)推動大模型進入真實業(yè)務場景,對穩(wěn)定性、準確性和可控性的要求顯著提高,這一階段的復雜度與成本同步上升,外部服務商開始承接越來越多任務。

Deccan AI正是在這一趨勢中切入市場。該公司提供從代碼能力提升、智能體訓練到模型調用API等外部工具的一整套服務,使模型能夠與真實軟件系統(tǒng)交互并完成復雜任務。相比早期以文本處理為主的模型應用,當前行業(yè)正在向“世界模型”演進,涉及機器人與視覺系統(tǒng),對數(shù)據(jù)質量和評估體系提出更高要求,這也進一步放大了后訓練的需求。

該公司與谷歌DeepMind等前沿實驗室合作,參與專家反饋生成、評估流程設計以及強化學習環(huán)境構建,同時向企業(yè)客戶提供評估工具Helix和運營自動化平臺。Deccan AI的客戶還包括云數(shù)據(jù)平臺Snowflake,目前已服務約10家客戶,并在同一時間運行數(shù)十個項目。

伴隨大模型商業(yè)化推進,圍繞后訓練形成的服務市場正在快速擴張。AI數(shù)據(jù)服務公司Scale AI與其競爭對手Surge AI,以及AI訓練服務商Turing、AI人才平臺Mercor等公司均在提供數(shù)據(jù)標注、評估與強化學習相關服務。與傳統(tǒng)數(shù)據(jù)標注不同,這一階段更依賴高學歷專家參與,對數(shù)據(jù)的專業(yè)性與一致性要求更高,同時交付周期往往被壓縮至數(shù)天之內,速度與質量之間的矛盾成為行業(yè)普遍挑戰(zhàn)。

二、后訓練質量容錯率接近為零,速度與精度之間的矛盾加劇

在后訓練階段,數(shù)據(jù)質量直接決定模型在真實環(huán)境中的表現(xiàn)。Deccan AI創(chuàng)始人Reddy說,這一環(huán)節(jié)對錯誤的容忍度“接近于零”,任何標注偏差或評估誤差都可能在上線后被放大,影響模型穩(wěn)定性與安全性。這使后訓練不再是簡單的數(shù)據(jù)加工,而是需要高度專業(yè)知識參與的精細化過程。數(shù)據(jù)往往必須具備明確的領域屬性,例如編程、金融或工程等專業(yè)場景。

這種高要求也帶來了規(guī)?;y題。相比早期以圖像識別為代表的標注任務,當前大模型后訓練更依賴具備碩士、博士背景的知識型勞動者。Deccan AI的貢獻者網(wǎng)絡超過100萬人,其中約10%擁有高等學位,在實際項目中這一比例會進一步提高。平臺每月活躍貢獻者在5000至10000人之間,覆蓋學生、行業(yè)專家與研究人員,但即便如此,高質量數(shù)據(jù)供給仍然受到限制。

Reddy說,AI實驗室往往要求在數(shù)天內完成大規(guī)模高質量數(shù)據(jù)交付,這意味著企業(yè)需要在極短周期內完成任務拆解、專家匹配與質量控制流程。對服務商而言,既要保證數(shù)據(jù)準確性,又要滿足快速迭代節(jié)奏,是運營上的核心挑戰(zhàn)。

圍繞這一環(huán)節(jié)的用工模式也持續(xù)引發(fā)討論。行業(yè)普遍依賴靈活用工來完成數(shù)據(jù)生產(chǎn),不同平臺的報酬差異較大。Deccan AI能給出的區(qū)間為每小時10美元至700美元(約合人民幣69元至4834元)不等,頂級貢獻者月收入最高可達7000美元(約合人民幣4.83萬元)。這一分布反映出后訓練任務的分層結構,基礎標注與高端專家任務在價值與門檻上差異明顯。

結語:后訓練外包市場成型,AI產(chǎn)業(yè)鏈分工格局初現(xiàn)

Deccan AI的融資是一個信號,說明圍繞大模型落地形成的后訓練服務市場已經(jīng)具備獨立規(guī)模。前沿模型的研發(fā)競爭仍在激烈推進,OpenAI、Anthropic、谷歌DeepMind與百度、阿里、DeepSeek等公司都在持續(xù)投入核心能力建設,但模型之外的后訓練工作正在加速流向專業(yè)服務商。

這條產(chǎn)業(yè)鏈的分工邏輯已經(jīng)清晰:誰來做模型、誰來做數(shù)據(jù)、誰來做評估,各自的位置正在成型。后訓練不再是模型研發(fā)的尾聲,而是決定模型能否真正落地的關鍵環(huán)節(jié),圍繞它形成的專業(yè)化分工,將是AI產(chǎn)業(yè)下一階段競爭的重要變量。

來源:TechCrunch