智東西(公眾號:zhidxcom)
作者 | ?ZeR0
編輯 | ?漠影

智東西7月8日報道,6月19日,在亞馬遜云科技中國峰會上,亞馬遜云科技全球技術(shù)總經(jīng)理Shaown Nandi發(fā)表主題演講,分享了亞馬遜云科技在云以及AI領(lǐng)域的最新技術(shù)洞察和進展。會后,Shaown Nandi接受智東西等媒體的采訪,他告訴智東西,亞馬遜云科技Amazon Bedrock平臺為構(gòu)建AI agent提供了更多模型選擇和靈活切換能力。借助Amazon Guardrails,用戶可在更換模型或模型版本時,無需重構(gòu)安全防護策略,簡化工作流程。此外,用戶還可以通過模型蒸餾、提示詞路由等機制優(yōu)化成本。

每個模型通常都有自己獨立的API接口,而Amazon Bedrock提供的是統(tǒng)一API入口,支持所有模型。這意味著即使未來更換模型,只要用戶最初用的是Amazon Bedrock的API,就無需改變調(diào)用方式,而且可以在平臺上選擇接入任意可用的模型。

在AI基礎(chǔ)設(shè)施投入和短期盈利的平衡方面,Shaown Nandi稱亞馬遜秉持長期主義,致力于幫助客戶實現(xiàn)長遠目標(biāo),幾周前還大幅降低了GPU價格以降低客戶成本。芯片廠商的芯片改進、模型本身的優(yōu)化,以及亞馬遜云科技的模型蒸餾、自動提示語路由等技術(shù),還有對GPU能耗的改進,都能推動推理成本的下降。

“AI技術(shù)的發(fā)展恰如巨型海浪的形成:看似平靜的漣漪在特定條件下也可演變?yōu)楦哌_30米的巨浪,生成式AI和Agentic AI同樣已從小規(guī)模的突破,發(fā)展成當(dāng)今的超級浪潮。而這一轉(zhuǎn)變主要由不斷創(chuàng)新的模型、海量可用數(shù)據(jù)及強大計算能力的融合所驅(qū)動。隨著企業(yè)從謹(jǐn)慎探索轉(zhuǎn)向廣泛應(yīng)用,以及亞馬遜云科技等領(lǐng)先科技公司在模型能力、準(zhǔn)確性、經(jīng)濟性與安全性等方面持續(xù)創(chuàng)新,這股AI超級巨浪正在重塑全球各個行業(yè)?!盨haown Nandi在演講中談道。

會后與媒體溝通期間,Shaown Nandi進一步分享說,Agentic AI和生成式AI已給很多公司帶來了切實可見的成果。而亞馬遜云科技的服務(wù)能幫助他們更好地利用自身數(shù)據(jù)、運力和計算能力打造應(yīng)用,解決業(yè)務(wù)難題。

被問到過去一兩年亞馬遜云科技從AI agent發(fā)展中看到的增長情況,他分享說,客戶使用和建立AI agent時會生成更多數(shù)據(jù)需要存儲,云存儲是更好的選擇,客戶對亞馬遜云科技提供的遷移數(shù)據(jù)方式感到振奮,隨著AI agent的發(fā)展,與云相關(guān)的使用活動也在增長,且財富500強中75%的工作負載仍在本地,未來遷移空間大,AI agent未來發(fā)展前景廣闊。

亞馬遜云科技平臺上有很多好的用戶案例和適用場景,比如在客戶服務(wù)方面,Agentic AI應(yīng)用旅行公司的一線坐席更快更準(zhǔn)確地回應(yīng)客戶,加入情緒分析和實時翻譯功能;軟件工程領(lǐng)域應(yīng)用增長也很快,亞馬遜云科技自己以及很多初創(chuàng)公司都在Amazon Bedrock上構(gòu)建了有效的AI agent。

在幫助客戶將AI agent落地到具體應(yīng)用場景時,亞馬遜云科技有多項獨特優(yōu)勢,包括提供更多模型選擇、解決無差異化體力活、讓客戶在構(gòu)建AI agent時能更快調(diào)整和更換模型,以及擁有韌性的基礎(chǔ)設(shè)施、自研芯片等,能為客戶提供更靈活、可靠、有效的解決方案。

關(guān)于客戶調(diào)用模型時是集中在少數(shù)幾個還是越來越分散,Shaown Nandi觀察到,模型多樣化趨勢明顯,專業(yè)、用途明確、能力強的模型不斷出現(xiàn),應(yīng)用場景增多,用戶模型選擇持續(xù)多元化。

Shaown Nandi還舉例說明了如何建立生成式AI應(yīng)用,建議利用Amazon Bedrock時需考慮模型選擇、成本、隱私和私密保護等因素。應(yīng)用開發(fā)方面,Amazon Transform能幫助客戶將遺留應(yīng)用遷移到亞馬遜云科技以實現(xiàn)現(xiàn)代化。Agent構(gòu)建方面,亞馬遜云科技提供了Amazon Bedrock、Strands Agents等工具?;A(chǔ)設(shè)施方面,亞馬遜云科技在全球建立的區(qū)域和專有區(qū)域網(wǎng)絡(luò),既與英偉達在云方面長達14年的合作,又有Amazon Trainium、Amazon Graviton等自研芯片,并提供S3 Tables、元數(shù)據(jù)存儲等高性能存儲工具。

在他看來,MCP對于AI agent來說是強大的解鎖器和解碼器,就像通用的USB-C,能讓AI agent更便捷地獲取服務(wù)和數(shù)據(jù),使其更自主化、智能化和自動化,前景廣闊,已有很多客戶及亞馬遜云科技自身在使用。

Shaown Nandi稱,所有類型的AI agent均可由合作伙伴或生態(tài)系統(tǒng)參與開發(fā),亞馬遜云科技開發(fā)的專有agent通常聚焦在自身有深厚專長的領(lǐng)域,或受客戶啟發(fā)填補市場空白,目標(biāo)是讓市場有更多選擇。亞馬遜云科技重視與合作伙伴協(xié)同,提供底層技術(shù)能力來幫助他們開發(fā)應(yīng)用。

談及企業(yè)級市場和C端市場在設(shè)計AI agent的區(qū)別,他認(rèn)為企業(yè)級應(yīng)用在設(shè)計初期就需考量安全性和韌性,再考慮功能實現(xiàn),而C端應(yīng)用初期更關(guān)注功能,兩者區(qū)別明顯,企業(yè)客戶重視亞馬遜云科技服務(wù)的韌性、安全性和可控性,在生成式AI使用中,數(shù)據(jù)使用與存儲至關(guān)重要,產(chǎn)品設(shè)計中已做大量控制以保護信息。

在開源策略上,Shaown Nandi篤定地說,亞馬遜云科技一直公開支持開源,Strands Agents便是一個開源工具。他相信專有模型和開源模型并存會給用戶更多選擇,也能讓全球開發(fā)者更好地回饋社會、共同發(fā)展。