智東西(公眾號(hào):zhidxcom)
編輯 | 云鵬

智東西5月12日?qǐng)?bào)道,近日,由智一科技旗下智能產(chǎn)業(yè)第一媒體智東西與AWE共同主辦的GTIC 2023全球AIoT智能家居峰會(huì)正式在上海舉辦,13位重磅嘉賓帶來(lái)了10場(chǎng)精彩演講,全景式解構(gòu)了新一輪家庭智能化變革。

峰會(huì)以“互聯(lián)新世界 智能新未來(lái)”為主題,圍繞智能家居產(chǎn)業(yè)近期熱點(diǎn)大模型ChatGPT和智能家居行業(yè)新標(biāo)準(zhǔn)Matter1.0的落地、全屋智能、家電智能化三大熱門話題進(jìn)行深入探討。

當(dāng)下,以ChatGPT為代表的AI大模型技術(shù)正從交互、內(nèi)容分發(fā)、文本理解等多方面影響智能家居產(chǎn)業(yè)發(fā)展,用戶可以獲得更加定制化的個(gè)人體驗(yàn)。個(gè)性化的全屋智能改造風(fēng)潮走進(jìn)消費(fèi)者群體,全屋智能賽道玩家們逐漸從以空間為主轉(zhuǎn)向以人為主的場(chǎng)景化智能家居生態(tài)建設(shè)。智能家居單品,也正在圍繞不同的應(yīng)用困境,做出新的升級(jí)。

在本次峰會(huì)上,聆思科技副總裁徐燕松圍繞《生成式大模型潮流下,智能家居端側(cè)智能化的未來(lái)》進(jìn)行了主題演講。隨著AIGC等新一代云端技術(shù)的突破,如何給市場(chǎng)提供更好體驗(yàn)、更高效率、更高性價(jià)比的端+云智能化解決方案,讓用戶使用智能家居更便捷,成為產(chǎn)業(yè)鏈上下游共同探討的話題。

以下為徐燕松演講實(shí)錄整理:

我今天分享一下聆思對(duì)于“在深度式大模型的潮流下,端側(cè)智能家居應(yīng)該有哪些改變和變化”這一問(wèn)題的一些深入思考。

一、從芯片、解決方案到一站式平臺(tái),用一攬子方案,完成設(shè)備智能化升級(jí)

聆思科技是一家是基于智能涌現(xiàn)時(shí)代的賦能者,整個(gè)聆思有四大塊業(yè)務(wù),一塊是AI芯片,另一塊是IoT芯片。只有芯片大家用不起來(lái),所以我們有對(duì)應(yīng)的解決方案,圍繞解決方案我們會(huì)有研、測(cè)、產(chǎn)、制的工具平臺(tái)。

聆思科技徐燕松:生成式大模型潮流下,智能家居端側(cè)智能化涌現(xiàn)變革

AI芯片需要與算法強(qiáng)耦合。我們經(jīng)??梢钥吹絺鹘y(tǒng)的芯片公司和AI芯片公司,最重要的是芯片和算法的耦合度,能不能做到極致的成本和算力“剛剛好”,算力的剛剛好和成本的剛剛好平衡。

第二,AI芯片因?yàn)槭沁B接芯片,一定要做端云一體,設(shè)備在線智能的連接器,如果沒有連接芯片,大模型在云端上是沒有機(jī)會(huì)落地的。

第三是解決方案,我們可以看到云端有服務(wù),我們端側(cè)需要有配套的一攬子解決方案,需要有符合不同場(chǎng)景的算法和芯片的耦合,如果不是耦合狀態(tài)的垂類方案,這個(gè)行業(yè)很難復(fù)制。

我們經(jīng)常跟客戶聊,他說(shuō)“你把音箱那個(gè)東西給我就行了,把空調(diào)那個(gè)東西裝我這上面就行了?!睂?shí)際上幾乎是走不通的,每一個(gè)不同垂直品類功能和場(chǎng)景化注定需要單獨(dú)的解決方案。

第四,能研出來(lái),不一定能產(chǎn)得出來(lái)。比如我們見過(guò)的某些客戶里,生產(chǎn)5萬(wàn)臺(tái)語(yǔ)音設(shè)備,需要人在產(chǎn)線上“喊”5萬(wàn)臺(tái),來(lái)驗(yàn)證整機(jī)語(yǔ)音到底能不能用。

我們認(rèn)為能研還要能產(chǎn),這是工業(yè)化最標(biāo)準(zhǔn)需要解決的問(wèn)題。我們有一套工具平臺(tái),包含研、制、產(chǎn)、測(cè),這套一攬子方案全部打包在一起,從AI芯片到loT到解決方案再到研測(cè)產(chǎn)制平臺(tái),交到客戶的手里,才能把一個(gè)設(shè)備從不智能升級(jí)為智能。

二、場(chǎng)景是AI能力與芯片耦合方案的試金石

我們經(jīng)常在內(nèi)部說(shuō)語(yǔ)音是“玄學(xué)”,我們舉一個(gè)掃地機(jī)器人的例子,機(jī)器的制噪很高,掃地毯、掃地板、掃地磚,看似都是掃地,但是從聲音的角度來(lái)看、從設(shè)備的角度來(lái)是看完全不同的,進(jìn)入到床底下、桌子底下的混響也是不同的,這些不同意味著你有沒有可用的跟場(chǎng)景可耦合的解決方案賦能到設(shè)備中去。

聆思科技徐燕松:生成式大模型潮流下,智能家居端側(cè)智能化涌現(xiàn)變革

圍繞著場(chǎng)景需要的是AI能力,從基礎(chǔ)的研發(fā)平臺(tái)到系統(tǒng)級(jí)的SDK,到功能性的SDK,到算法的SDK,必須做耦合,耦合后呈現(xiàn)出來(lái)的是語(yǔ)音交互的解決方案、音頻的解決方案、降噪的解決方案、視覺的解決方案、教育電子解決方案,包括音視頻融合多模態(tài)的解決方案。

這些解決方案再繼續(xù)生長(zhǎng),生長(zhǎng)到每一個(gè)垂直產(chǎn)品和垂直領(lǐng)域里的垂類方案。聆思一直在做的是解決方案工廠,這個(gè)工廠是賦能給行業(yè)和我們合作伙伴的。

我們有幾個(gè)核心的觀點(diǎn):第一,有不等于可用;第二,可用不等于好用;第三,好用不等于易用。

只有易用客戶才會(huì)買單,否則沒有人買單。我們一直認(rèn)為我們要從有到可用,一直到易用,都做到前沿技術(shù)的持續(xù)引領(lǐng),所以我們也落地了很多場(chǎng)景。

聆思科技徐燕松:生成式大模型潮流下,智能家居端側(cè)智能化涌現(xiàn)變革

三、ChatGPT智能涌現(xiàn),實(shí)現(xiàn)七大智能維度突破,帶來(lái)六大重要變革

我們一直在討論,“沒有成功的企業(yè),只有時(shí)代的企業(yè)”。剛才主持人和徐東生副理事長(zhǎng)說(shuō)了,現(xiàn)在家電已經(jīng)有了很大的變革,大家都在討論大模型。我上一周到深圳參加深圳灣的創(chuàng)業(yè)會(huì),突然發(fā)現(xiàn)從大工廠、大企業(yè)研發(fā)到小工廠都在討論一個(gè)問(wèn)題:“GPT能幫我干嘛?”我真的覺得是全面GPT的感覺,連續(xù)開了三個(gè)論壇、兩個(gè)會(huì),大家都在談這個(gè)事兒,茶余飯后不談這個(gè)事兒我可能就“OUT”了。

大模型時(shí)代帶來(lái)了很多驚艷的東西,確實(shí)帶來(lái)了智能涌現(xiàn)。首先我們認(rèn)為對(duì)話式AI帶來(lái)了很大的躍升;第二,圖像輸入的時(shí)候多模態(tài)的統(tǒng)一語(yǔ)義理解能力持續(xù)上升,甚至已經(jīng)到了可用和易用的狀態(tài)了。

聆思科技徐燕松:生成式大模型潮流下,智能家居端側(cè)智能化涌現(xiàn)變革

給端側(cè)、設(shè)備和合作伙伴帶來(lái)什么?我們看到有7個(gè)方面重大突破:

第一,海量信息參數(shù)化全量記憶;第二,任意任務(wù)的對(duì)話式理解;第三,復(fù)雜邏輯思維鏈推理;第四,多角色、多風(fēng)格長(zhǎng)文本的生成。

前面跟很多嘉賓聊的時(shí)候說(shuō)到,內(nèi)部的小朋友說(shuō)GPT大模型是一個(gè)話癆,它每次都回答我那么多,當(dāng)然我們會(huì)對(duì)它進(jìn)行優(yōu)化,讓它有一個(gè)更合理、更精準(zhǔn)的反饋。

第五,即時(shí)交互的修正能力會(huì)支持進(jìn)化。我們經(jīng)常會(huì)跟他說(shuō):“你說(shuō)的不對(duì),你重新想一下,上網(wǎng)上重新搜一下。”它會(huì)給你一個(gè)新的答案,具備即時(shí)交互的修正能力。

第六,程序代碼自動(dòng)生成。我們做過(guò)很多測(cè)試,在安卓的平臺(tái)上,我們希望遷移到Linux,把規(guī)則告訴它,它可以自己做很多代碼生成。第七,輸入圖像的語(yǔ)義層理解。

大模型能給產(chǎn)業(yè)帶來(lái)什么?第一,是全面升級(jí)的人機(jī)交互。聆思的愿景是讓所有設(shè)備能聽會(huì)說(shuō),這是我們成立之初的愿景。讓所有設(shè)備能聽會(huì)說(shuō),首先需要有精準(zhǔn)的、更好的人機(jī)交互方式,大模型給這個(gè)產(chǎn)業(yè)帶來(lái)重大的變革。

聆思科技徐燕松:生成式大模型潮流下,智能家居端側(cè)智能化涌現(xiàn)變革

第二,革新內(nèi)容生成和內(nèi)容生產(chǎn)方式。大家在各個(gè)演示中看到了,也體驗(yàn)到了。還有改變信息分發(fā)的各種獲取方式、虛擬世界和現(xiàn)實(shí)民生的一些結(jié)合、用AI做醫(yī)療,做很多分子陣列的測(cè)算。最后,我們會(huì)促進(jìn)開發(fā)者生態(tài)的發(fā)展,因?yàn)檫@是一個(gè)共創(chuàng)的過(guò)程。

四、基于大模型的新一代多模態(tài)人機(jī)交互

當(dāng)大模型給這個(gè)產(chǎn)業(yè)帶來(lái)重大發(fā)展變革和機(jī)遇的時(shí)候,聆思也在想如何給合作伙伴提供大模型新一代人機(jī)交互的解決方案。這是我們給很多合作伙伴提供的大模型新一代的多模態(tài)人機(jī)交互框架,把多模的識(shí)別,或者語(yǔ)音、圖像、視覺包含其他,會(huì)有輸入,我們同時(shí)有大模型交互里非常核心的提示功能。

聆思科技徐燕松:生成式大模型潮流下,智能家居端側(cè)智能化涌現(xiàn)變革

我們自己內(nèi)部討論一件事情,大模型用得好不好,先是你問(wèn)題問(wèn)得好不好,如果你問(wèn)得好、越精準(zhǔn),模型的反饋越精準(zhǔn),所以我們叫做“提示工程”。

另外,我們把很多傳統(tǒng)的AI能力,比如翻譯、多語(yǔ)種、變聲,傳統(tǒng)的AI能力和內(nèi)容的信源打包,打包完后有類似虛擬的中樞大腦,基于大模型業(yè)務(wù)的服務(wù)調(diào)動(dòng)和內(nèi)容分發(fā)融合,最后在端側(cè)有輸出層,端側(cè)輸出層可以看到有語(yǔ)音合成、虛擬形象、圖像合成、視頻合成,這是聆思基于大模型的端側(cè)給所有端賦能的內(nèi)容和賦能的方向。

基于大模型多模態(tài)人機(jī)交互,我們認(rèn)為有五點(diǎn)可以明確讓大家拿來(lái)用的。

聆思科技徐燕松:生成式大模型潮流下,智能家居端側(cè)智能化涌現(xiàn)變革

第一,多輪對(duì)話的貫穿能力。很多傳統(tǒng)設(shè)備,我們經(jīng)常說(shuō)容易“把天聊死”,現(xiàn)在大模型的多輪對(duì)話的貫穿能力可以進(jìn)行意圖識(shí)別,滿足客戶的需求。

第二,知冷暖的共情閑聊對(duì)話能力。我們?cè)?jīng)討論一個(gè)場(chǎng)景,未來(lái)老人的陪伴和陪護(hù),誰(shuí)陪空巢老人聊天,誰(shuí)提醒他吃飯、吃藥,誰(shuí)去情感化、擬人化的思路或者交互方式去陪伴他,誰(shuí)去呵護(hù)和關(guān)懷,這里面是有溫度的,而且我們認(rèn)為意圖判斷的時(shí)候會(huì)把情感識(shí)別放到里面。

第三,基于文檔的新知識(shí)快速學(xué)習(xí)能力。比如一個(gè)烤箱的說(shuō)明書,一個(gè)新的設(shè)備怎么用,把說(shuō)明書給它,你可以問(wèn)它怎么用,比如這個(gè)烤箱怎么用,怎么按鍵。

第四,無(wú)所不知的應(yīng)用能力。從提問(wèn)人的角色和關(guān)系角度理解分析問(wèn)題。比如,今天提醒我要吃二甲雙胍,我今天還不太舒服要吃另外一個(gè)藥,但是這兩個(gè)藥互斥,機(jī)器可以告訴你。

第五,基于海量用戶的修正意見的進(jìn)化能力??梢圆粩嗟剡M(jìn)化,比如我想打開空調(diào),每次我最舒服的溫度是23度,我以后再打開空調(diào)就給我調(diào)23度,這是我的要求,告訴它每次自動(dòng)設(shè)定,適合我的溫度,這種不斷修正客戶意見的進(jìn)化能力。

基于大模型可以看到,傳統(tǒng)的智能家居里控制的時(shí)候是人設(shè)定模式,今天已經(jīng)有了訪客模式、回家模式、就餐模式,我們有一個(gè)APP,大家在里面設(shè)置,有多少設(shè)備,有燈、空調(diào)、冰箱、照明、應(yīng)急設(shè)備,設(shè)立一個(gè)模式以后說(shuō)你幫我啟動(dòng)一個(gè)模式,這是傳統(tǒng)的,未來(lái)不是這樣的。

這是我們做的測(cè)試,給我一個(gè)熱帶雨林的感覺,這是很模糊的模式,它知道我有什么設(shè)備,自己去安排,熱帶雨林是什么樣子,它理解的是什么樣子,比如說(shuō)冰雪世界,我應(yīng)該穿什么樣的衣服,今天股票怎樣,明天會(huì)下雨嗎,我今天心情不好,你跟我聊天,這些東西都是可以呈現(xiàn)的。

有兩個(gè)核心的點(diǎn),第一是個(gè)性化的提升工程設(shè)計(jì),該如何交付提示功能設(shè)置。第二是針對(duì)提示工程生成最佳的結(jié)果,比較寬泛。后面有一個(gè)視頻,也是我們?cè)贏WE現(xiàn)場(chǎng)搭建的一個(gè)視頻,大家可以在現(xiàn)場(chǎng)看到、體驗(yàn)到、可以玩的。

聆思科技徐燕松:生成式大模型潮流下,智能家居端側(cè)智能化涌現(xiàn)變革

所以我們認(rèn)為新一代大模型會(huì)改變5件事情:第一,家庭信息充分掌握和利用越來(lái)越重要;第二,無(wú)所不至的小助理一定會(huì)出現(xiàn);第三,專業(yè)家庭智慧管家未來(lái)會(huì)在我們生活中必然出現(xiàn);第四,優(yōu)秀結(jié)果的最佳呈現(xiàn),無(wú)論是語(yǔ)音、圖像等呈現(xiàn)方式一定會(huì)有最佳的表現(xiàn);第五,不同功能區(qū)凸顯專項(xiàng)智能,大模型是通用能力,在專項(xiàng)智能上大家才最希望看到的。

聆思科技徐燕松:生成式大模型潮流下,智能家居端側(cè)智能化涌現(xiàn)變革

下面有一個(gè)視頻,大家可以看一下(播放視頻)。剛才視頻里我們應(yīng)用了幾個(gè)部分:第一是端側(cè)變化,我們可以看到應(yīng)用了女生的虛擬形象,每一句話的時(shí)候口型和字是對(duì)在一起的,包括會(huì)有一些動(dòng)作和肢體的虛擬形象。第二是Smart TTS,這里面是一個(gè)常規(guī)的女生形象,我們可以基于不同的形象和不同情緒有不同的聲音變化。第三是大模型做了很多的理解、認(rèn)知和推理。

我們?cè)谡桂^W3館有針對(duì)客戶定向邀約體驗(yàn)的一套系統(tǒng),大家可以去我們展館,親自體驗(yàn)這一套設(shè)備,我們接了空調(diào)、燈、風(fēng)扇、音箱這幾個(gè)產(chǎn)品,大家可以去現(xiàn)場(chǎng)模擬體驗(yàn),問(wèn)了很多開放性問(wèn)題,也很有意思。

以上是徐燕松演講內(nèi)容的完整整理。