智東西(公眾號:zhidxcom)
作者?|?程茜
編輯?|?漠影

客人來訪,你不需要走到門口透過貓眼才能確認(rèn)是誰,和手機聯(lián)動的可視門鈴、可視門鎖讓你在任何地方不僅與客人視頻通話,還能無縫語音聊天;當(dāng)你出差、旅游時是不是擔(dān)心家里的寵物沒有人陪伴?現(xiàn)在能傳遞畫面、實時與寵物對話的攝像頭出現(xiàn)……越來越多能夠?qū)崟r與我們交互的設(shè)備出現(xiàn)在生活中。

音視頻物聯(lián)網(wǎng)行業(yè)起勢,實時互動成智能設(shè)備的“硬指標(biāo)”!

▲亞馬遜旗下Ring的智能可視門鈴

這些功能在幾年前我們可能還無法想象,但現(xiàn)在實時音視頻、實時互動等功能在諸如此類的智能硬件中已經(jīng)成為標(biāo)配。

就在上周四,RTE 2022第八屆實時互聯(lián)網(wǎng)大會IoT分論壇落幕,我們可以看到,實時互動技術(shù)已經(jīng)在智能家居、無人機、機器人、AR眼鏡等多個行業(yè)內(nèi)落地,并在不斷拓展智能設(shè)備的新應(yīng)用場景。

成立于2014年的聲網(wǎng),已經(jīng)在實時互動領(lǐng)域積累了多年經(jīng)驗,作為底層技術(shù)的賦能者,能夠幫助行業(yè)玩家在其應(yīng)用內(nèi)構(gòu)建多種實時音視頻互動場景。

那么,音視頻物聯(lián)網(wǎng)市場的發(fā)展空間有多大?實時互動技術(shù)能為物聯(lián)網(wǎng)設(shè)備帶來哪些變革?

帶著這些問題,智東西和聲網(wǎng)IoT行業(yè)負(fù)責(zé)人侯云憶進行了深入交流,從聲網(wǎng)在音視頻物聯(lián)網(wǎng)領(lǐng)域的布局出發(fā),以實時互動技術(shù)為核心,理清音視頻物聯(lián)網(wǎng)領(lǐng)域的發(fā)展脈絡(luò)。

一、“物超人”時代到來,互動從準(zhǔn)實時邁向真實時

如今,物聯(lián)網(wǎng)產(chǎn)業(yè)正在飛速發(fā)展,工業(yè)和信息化部的數(shù)據(jù)顯示,截至今年8月末,我國三家基礎(chǔ)電信企業(yè)發(fā)展移動物聯(lián)網(wǎng)終端用戶16.98億戶,較上年末凈增3億戶;代表“物”連接的移動物聯(lián)網(wǎng)終端用戶數(shù)首次超出代表“人”連接的移動電話用戶數(shù),占比已達(dá)50.3%。

我國已經(jīng)正式邁入“物超人”時代,與此同時,音視頻物聯(lián)網(wǎng)也迎來快速增長期,智能家居、機器人、無人機等設(shè)備在互動過程中往往都需要實時音視頻技術(shù)支持,來達(dá)到更加沉浸式的互動體驗。

從其較為主要的連接和交互層面來看,侯云憶談道:“從這個視角看,音視頻物聯(lián)網(wǎng)的演進可以分為三個階段?!?/p>

事實上,隨著硬件設(shè)備的智能化升級加速,第一個階段已經(jīng)離我們有一些遙遠(yuǎn)。早期以傳統(tǒng)安防為代表的慢直播時代,只能做到事后分析、回述、查看,通信時延在2-5秒以上。

這之后,還是以安防為例,用戶可以通過手機APP實時查看攝像頭中的畫面,并聽到其中的聲音。侯云憶談道,這一階段可以做到即時連接,時延在1-2秒。但這仍然不是完全的實時互動,原因在于,用戶只能通過攝像頭進行單向互動,也就是只能即時預(yù)覽、邊聽邊看,但無法做到與攝像頭另一端的人進行實時對話、交流,因此,這一階段被稱為“準(zhǔn)實時”。

不過,隨著交互性在智能硬件中的重要性逐步提升,單向傳輸?shù)摹皽?zhǔn)實時”已經(jīng)無法滿足現(xiàn)有的用戶需求。因此,完全的實時互動正在成為物聯(lián)網(wǎng)領(lǐng)域各路玩家的必爭之地。

在“真實時”階段,就是讓音視頻設(shè)備實時互動,使得人和人、人和物之間都能實時、多人、跨端、以任意規(guī)模進行互動,侯云憶談道,聲網(wǎng)將其時延提升至全球端到端400ms之內(nèi)。

音視頻物聯(lián)網(wǎng)正在從“準(zhǔn)實時”向“真實時”演進。

音視頻物聯(lián)網(wǎng)行業(yè)起勢,實時互動成智能設(shè)備的“硬指標(biāo)”!

可以看到的是,這一技術(shù)升級的成果正在不斷涌現(xiàn)。諸如智能門鎖、智能音箱等在內(nèi)的物聯(lián)網(wǎng)設(shè)備不斷在實時互動方面迸發(fā)出火花?,F(xiàn)如今,人們對于智能化生活的需求更加深入,能聽、能說、能看已經(jīng)成為其所需的智能硬件必備技能。

從宏觀角度來看,各路玩家在物聯(lián)網(wǎng)領(lǐng)域加碼業(yè)務(wù)布局的同時,一個突出的趨勢就是,實時互動已經(jīng)成為智能硬件的“核心功能”。

二、實時互動成智能設(shè)備應(yīng)用落地硬指標(biāo)

事實上,音視頻物聯(lián)網(wǎng)領(lǐng)域不論是技術(shù)的進步,還是新應(yīng)用場景的誕生都不是相互獨立發(fā)展,而是相輔相成的,并不斷驅(qū)動行業(yè)螺旋式上升。我們可以從一些具體應(yīng)用場景來抽絲剝繭。

1、經(jīng)典硬件設(shè)備智能化升級

比較典型的一類應(yīng)用場景,就是經(jīng)典IPC(網(wǎng)絡(luò)攝像頭)設(shè)備通過RTC(Real-time Communication,實時音視頻)技術(shù)得到增強。

早期智能門鎖多采用密碼、指紋識別來解鎖,現(xiàn)在這些識別方式已經(jīng)逐漸“淡出”消費者選購的。今年4月,TCL發(fā)布3D人臉識別屏幕鎖X10;9月,小米新款人臉識別智能門鎖支持3D結(jié)構(gòu)光人臉識別;10月,海爾智能3D人臉可視貓眼鎖SV30發(fā)布,華為也在秋季發(fā)布會上主打了分布式可視貓眼功能……侯云憶補充道,頭部品牌的數(shù)據(jù)顯示,現(xiàn)在視頻通話在智能門鎖中的滲透率已經(jīng)超過40%。

音視頻物聯(lián)網(wǎng)行業(yè)起勢,實時互動成智能設(shè)備的“硬指標(biāo)”!

▲華為智能門鎖Pro

除此以外,小米智能硬件事業(yè)部產(chǎn)品總監(jiān)梁浩說:“此前,我們對于智能家居的印象是相對比較冰冷的,它們只跟設(shè)備、控制相關(guān),缺少了與人之間的情感連接。”而現(xiàn)在,音視頻在智能家居中的應(yīng)用增加了視頻通話、遠(yuǎn)程看家和智能門鈴,智能家居也變成了一個“溫暖的伙伴”。

可以看出,這些玩家在智能門鎖這一細(xì)分賽道中,已經(jīng)開始在實時互動上抱團。這也預(yù)示著,以經(jīng)典IPC設(shè)備為代表的產(chǎn)品,其智能化升級需求激增。

2、軟件服務(wù)催生高黏性細(xì)分場景

還有一類是以“設(shè)備即服務(wù)”為邏輯涌現(xiàn)出的新應(yīng)用。以遠(yuǎn)程陪伴產(chǎn)品為例,用戶離家場景下,曾經(jīng)家中的安防攝像頭扮演的角色就是觀察家中的狀況,而現(xiàn)在,“更多通用硬件平臺開始圍繞著幼兒、寵物等深耕細(xì)分品類,面向用戶的情緒價值和情感訴求來開發(fā)新產(chǎn)品?!焙钤茟浾劦?。

基于此,家庭服務(wù)機器人這一新品類誕生。其中,陪伴就成為其中一項重要功能,作為全球智能家居硬件的風(fēng)向標(biāo)亞馬遜,今年專門為其家庭服務(wù)機器人Astro進行了一項更新,該機器人兼容智能視頻門鈴服務(wù)和Alexa語音交互,讓用戶可以和家中的寵物實時對話。

音視頻物聯(lián)網(wǎng)行業(yè)起勢,實時互動成智能設(shè)備的“硬指標(biāo)”!

▲亞馬遜家庭服務(wù)機器人Astro可以實時觀察家中寵物情況

如幼兒、寵物陪伴這類細(xì)分場景,曾經(jīng)可能只能通過手機才能實現(xiàn),現(xiàn)如今,實時互動技術(shù)在智能硬件設(shè)備中的廣泛應(yīng)用,使得越來越多的高用戶黏性細(xì)分場景出現(xiàn)。

3、視覺交互向弱需求設(shè)備普及

除了這些對視覺交互、實時對話功能需求較為顯著的設(shè)備,攝像頭等硬件的適用范圍也在逐漸普及,如掃地機器人這一品類,它更多的功能是清潔、避障等,但為了提升用戶的體驗,部分玩家為其添加了攝像頭,讓掃地機器人的功能性進一步提升,從智能清潔助手升級為“智能管家”。

追覓機器人產(chǎn)品總監(jiān)孟佳談道,掃地機器人未來發(fā)展為更加智能化的機器人,比如說可以升級為未來家庭服務(wù)類的機器人是該品類的重要發(fā)展方向之一。

音視頻物聯(lián)網(wǎng)行業(yè)起勢,實時互動成智能設(shè)備的“硬指標(biāo)”!

此外,To B場景下,實時互動也在革新人們的工作方式和效率。如無人機、巡檢機器人等。侯云憶透露,在無人機和機器人場景,通過聲網(wǎng)RTC超低延時全鏈路優(yōu)化,能實現(xiàn)高清多路視頻傳輸和可靠性遠(yuǎn)程控制,可以做到端到端160ms平行駕駛和平行操控。

大疆IoT平臺負(fù)責(zé)人劉翰林補充道,未來基于IoT和實時音視頻技術(shù)應(yīng)用,無人機技術(shù)將會深入到各行各業(yè)中。

這些案例都在向我們闡述一個事實,實時互動技術(shù)搭載于智能硬件設(shè)備中的必要性和急迫性都愈加明顯。

因此,這一產(chǎn)業(yè)鏈背后的玩家都在積極推進,然而,物聯(lián)網(wǎng)行業(yè)還有一個顯著特點,就是產(chǎn)業(yè)鏈冗長,且碎片化特征明顯,因此,需要上下游玩家的鏈接,才能加速這一產(chǎn)業(yè)在音視頻領(lǐng)域的變革。

在這其中,聲網(wǎng)扮演的角色就是應(yīng)用層玩家的底層技術(shù)賦能者,但同時物聯(lián)網(wǎng)產(chǎn)業(yè)的特征決定了其生態(tài)建設(shè)的重要性,因此,聲網(wǎng)同樣會基于其在實時音視頻領(lǐng)域的技術(shù)積累,加速應(yīng)用層玩家的產(chǎn)品落地。

三、音視頻物聯(lián)網(wǎng)發(fā)展脈絡(luò)清晰,底層技術(shù)玩家起勢

現(xiàn)在隨著物聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展加速,音視頻物聯(lián)網(wǎng)的發(fā)展趨勢也逐漸明晰。侯云憶談道,現(xiàn)在有三個比較明顯的趨勢。如今,用戶對于沉浸式通信的需求不斷迭代,技術(shù)層面上通過邊端協(xié)同來完善硬件連接,使其在交互上釋放更好地性能。

此外,現(xiàn)有的物聯(lián)網(wǎng)設(shè)備正在走向互聯(lián)互通,也就是從單品智能向場景化發(fā)展,實現(xiàn)多設(shè)備的協(xié)同、聯(lián)動,以及一些物聯(lián)網(wǎng)玩家的商業(yè)模式正在從更好地連接向更好地服務(wù)轉(zhuǎn)變。不過,這些趨勢的演進都離不開現(xiàn)有技術(shù)的迭代,其最核心的還是底層技術(shù)的可用性。

因此,作為在實時音視頻領(lǐng)域積累了多年技術(shù)經(jīng)驗的聲網(wǎng),基于這幾大發(fā)展趨勢,確立了面向通用技術(shù)和場景化的兩大聚焦點。侯云憶說:“這是因為我們看到了真實的市場需求有一些技術(shù)的空白?!?/p>

以此為核心,聲網(wǎng)已經(jīng)覆蓋可穿戴、智能家居和出行等40多個品類,為開發(fā)者提供高可靠和低延時音視頻流媒體和可靠信令消息的能力,以及端到端的解決方案,使其在產(chǎn)品上能夠快速實現(xiàn)視頻通話、遠(yuǎn)程協(xié)作、遠(yuǎn)程控制、緊急呼叫等功能。

其中,面向XR終端設(shè)備場景,聲網(wǎng)也率先看到了這一市場的發(fā)展?jié)摿?,能夠在這一場景中豐富數(shù)據(jù)傳輸種類和同步數(shù)據(jù)形式。

Rokid產(chǎn)品技術(shù)總監(jiān)趙維奇談道,人們通過AR技術(shù)將常見的起居、戶外營地、交通場景產(chǎn)生變化,包含延展起居空間、AR和實時通信組合增加戶外娛樂方式、AR技術(shù)幫助人們在路上正常工作,在實時互動、通信,在新技術(shù)的加持下,使我們曾經(jīng)想象的場景不斷落地。

談及實時互動在這一市場中的重要性時,侯云憶認(rèn)為,如果說世界是一個元宇宙的話,那么物聯(lián)網(wǎng)就是感知層的最重要基礎(chǔ)設(shè)施,實時互動就是其中的神經(jīng)或者血脈,也是其中最重要的通訊基礎(chǔ)設(shè)施,ARVR技術(shù)就是用戶在元宇宙世界中重要的互動界面。

綜合起來,以虛擬空間為代表的沉浸式互動方式必然會驅(qū)動實時互動技術(shù)的快速發(fā)展,未來,甚至?xí)崿F(xiàn)千人同頻互動場景的愿景。

同時,為了讓開發(fā)者能夠更低門檻的使用相關(guān)解決方案,聲網(wǎng)今年6月推出了靈隼物聯(lián)網(wǎng)云平臺。

音視頻物聯(lián)網(wǎng)行業(yè)起勢,實時互動成智能設(shè)備的“硬指標(biāo)”!

▲靈隼物聯(lián)網(wǎng)云平臺

侯云憶告訴智東西,靈隼物聯(lián)網(wǎng)云平臺的定位是aPaaS(應(yīng)用程序平臺即服務(wù))應(yīng)用級平臺,其目的就是為開發(fā)者提供一站式解決方案。在這其中,“聲網(wǎng)上不碰業(yè)務(wù),下不落盤數(shù)據(jù)”。不僅在產(chǎn)業(yè)鏈路中起到了連接作用,并且其平臺不會留存數(shù)據(jù),能夠保護用戶數(shù)據(jù)安全隱私。

當(dāng)然,構(gòu)建這一開放、易用的物聯(lián)網(wǎng)云平臺,離不開聲網(wǎng)此前的技術(shù)積累,以及其在生態(tài)建設(shè)上的理念。

其中,聲網(wǎng)實時音視頻技術(shù)和其構(gòu)建平臺式產(chǎn)品的端到端能力、云平臺解決方案能力,是其最堅固的底座。此外,正如我們前文提到的,物聯(lián)網(wǎng)冗長的產(chǎn)業(yè)鏈,也給產(chǎn)業(yè)玩家提出了考驗,因此,作為全球化服務(wù)提供者,聲網(wǎng)在安全合規(guī)的基礎(chǔ)上,將目光聚焦到了實時互動技術(shù)本身,并以點帶面,加速生態(tài)構(gòu)建。

不僅如此,聲網(wǎng)還加入了OLA(開放智聯(lián)聯(lián)盟)聯(lián)盟,這一聯(lián)盟對國內(nèi)物聯(lián)網(wǎng)玩家的意義重大,將有可能改善物聯(lián)網(wǎng)碎片化難題,因此,為了加速音視頻物聯(lián)網(wǎng)行業(yè)的發(fā)展,聲網(wǎng)在OLA發(fā)起成立了音視頻小組,積極推動音視頻設(shè)備互聯(lián)互通標(biāo)準(zhǔn)方案落地。

一個產(chǎn)業(yè)的發(fā)展離不開行業(yè)標(biāo)準(zhǔn)的完善,隨著相關(guān)標(biāo)準(zhǔn)的推進,關(guān)于實時音視頻在物聯(lián)網(wǎng)行業(yè)中無處不在的愿景將加速實現(xiàn)。

結(jié)語:音視頻物聯(lián)網(wǎng)行業(yè)勢頭正好

物聯(lián)網(wǎng)行業(yè)發(fā)展加速,萬物互聯(lián)時代到來。實時互動的物聯(lián)網(wǎng)設(shè)備已經(jīng)在改變著我們的生活和工作,從其落地的產(chǎn)品形態(tài)、功能來看,實時音視頻在物聯(lián)網(wǎng)中的應(yīng)用正在加速。

即便不同物聯(lián)網(wǎng)設(shè)備間對于音視頻的需求不同,但聲網(wǎng)在其中扮演的底層技術(shù)賦能者角色,在為這些玩家打包解決方案的同時,讓上下游的生態(tài)伙伴聯(lián)動起來,促進實時互動在智能設(shè)備場景應(yīng)用中的落地與普及。

隨著物聯(lián)網(wǎng)產(chǎn)業(yè)的不斷成熟,音視頻物聯(lián)網(wǎng)行業(yè)玩家將會給我們帶來更多新故事。