AI應(yīng)用風(fēng)向標(biāo)(公眾號:ZhidxcomAI)
作者|江宇
編輯|漠影

智東西2月28日報道,昨日,上海多模態(tài)Agent創(chuàng)企VUI Labs(宇生月伴)宣布完成數(shù)千萬元天使+輪融資。本輪由同創(chuàng)偉業(yè)領(lǐng)投,老股東靖亞資本、小苗朗程持續(xù)加注,心流資本FlowCapital擔(dān)任長期財務(wù)顧問。

據(jù)企查查公開信息顯示,其此前融資經(jīng)歷如下:

2025年8月18日,VUI Labs完成天使輪融資,融資金額為數(shù)千萬元,投資方包括小苗朗程、靖亞資本、小苗基金和茵源資產(chǎn)。

2025年9月11日,VUI Labs完成又一輪天使輪融資,投資方為小苗朗程。

VUI Labs半年累計獲得近億元投資,所募資金將用于核心模型迭代、產(chǎn)品和商業(yè)化落地、全球人才引進(jìn)及Voice Agent平臺建設(shè),進(jìn)一步夯實(shí)公司在“超低延遲+情感交互+多模態(tài)智能體(Agent)+端側(cè)模型”上的綜合壁壘。

VUI Labs成立于2025年初,由教育部長江學(xué)者、上海交通大學(xué)計算機(jī)學(xué)院特聘教授、人工智能學(xué)院雙聘教授、聽覺認(rèn)知與計算聲學(xué)研究中心負(fù)責(zé)人錢彥旻創(chuàng)辦。

聯(lián)合創(chuàng)始人兼CEO梅杰,畢業(yè)于浙江大學(xué)竺可楨學(xué)院創(chuàng)新與創(chuàng)業(yè)管理強(qiáng)化班。

上海語音Agent團(tuán)隊(duì)融資近億,浙大校友創(chuàng)辦

▲VUI Labs(宇生月伴)創(chuàng)始人兼CEO梅杰(圖源:企查查)

在技術(shù)路徑上,VUI Labs基于端到端語音模型的長期積累,自研多模態(tài)情感交互語音大模型Luna系列

上海語音Agent團(tuán)隊(duì)融資近億,浙大校友創(chuàng)辦

▲圖源:VUI Labs官網(wǎng)

VUI Labs團(tuán)隊(duì)于2019年在全球首次提出端到端語音模型訓(xùn)練方法。與此同時,VUI Labs覆蓋全棧語音模型技術(shù),在超低延時、情感語音交互、情感語音生成、多說話人理解等方面對標(biāo)Google、ElevenLabs、OpenAI、Hume AI、Sesame等語音模型廠商。

其中,作為端到端情感語音交互模型,Luna-1在VoiceBench測評中獲得79.05分,屬于行業(yè)第一梯隊(duì),語音對話延遲為1.4秒,達(dá)到行業(yè)領(lǐng)先水平。

上海語音Agent團(tuán)隊(duì)融資近億,浙大校友創(chuàng)辦

▲圖源:VUI Labs宇生月伴

Luna-TTS-1語音合成模型延遲低至200毫秒,自然度、可控性、穩(wěn)定性方面穩(wěn)居TTS行業(yè)第一梯隊(duì)。

其依托由自主可控的高吞吐數(shù)據(jù)管線持續(xù)生產(chǎn)的高質(zhì)量語音數(shù)據(jù),通過深度場景化優(yōu)化實(shí)現(xiàn)穩(wěn)定可靠的輸出效果。

在同聲傳譯方向,VUI Labs團(tuán)隊(duì)提出SimulMEGA(Simultaneous Generation by Mixture-of-Experts Gating)無監(jiān)督策略學(xué)習(xí)框架,將基于前綴的訓(xùn)練與混合專家精煉器結(jié)合,在不增加推理階段額外開銷的情況下學(xué)習(xí)讀寫決策。

基于該框架推出的Luna-Live-Translation-1為可端側(cè)部署的同聲傳譯模型,模型大小為500M,延遲為1.5秒,支持?jǐn)?shù)十種語言互譯,目前已在某知名手機(jī)品牌歐洲版本中落地。

產(chǎn)品層面,VUI Labs于2026年1月推出首個C端語音智能體產(chǎn)品SaySo(sayso.ai)。該產(chǎn)品定位為智能語音助手,圍繞語音Agent交互構(gòu)建多步規(guī)劃、工具調(diào)用、長時記憶與智能體編排等能力,實(shí)現(xiàn)從語音交互到任務(wù)執(zhí)行的完整鏈路。