智東西(公眾號(hào):zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西2月17日?qǐng)?bào)道,隨著DeepSeek展現(xiàn)出開(kāi)源的威力,大模型競(jìng)賽有了新的敘事方式,各路云計(jì)算廠商接連宣布接入DeepSeek模型,但實(shí)際提供的服務(wù)質(zhì)量卻參差不齊。這與云服務(wù)背后的基礎(chǔ)設(shè)施和工程化能力密切相關(guān)。

企業(yè)部署和使用模型過(guò)程中,需要綜合考量性能與成本之間的權(quán)衡、能否針對(duì)私有數(shù)據(jù)進(jìn)行定制優(yōu)化、數(shù)據(jù)和模型安不安全、是否便于實(shí)現(xiàn)各種智能體的復(fù)雜調(diào)度等因素。亞馬遜云科技則通過(guò)在云和AI領(lǐng)域展開(kāi)的全棧式創(chuàng)新,兼具云端本身的優(yōu)勢(shì)、多樣化模型選擇的優(yōu)勢(shì),并提供了一系列快速將模型運(yùn)用到企業(yè)化生產(chǎn)環(huán)境中所需的重要工具。

作為最早適配并上線DeepSeek的云巨頭之一,亞馬遜云科技現(xiàn)已推出針對(duì)DeepSeek-R1模型多種不同的部署方式,以便企業(yè)能在熟悉的亞馬遜云科技環(huán)境中輕松部署該系列模型,例如在Amazon Bedrock Marketplace中部署,或在Amazon SageMaker Jumpstart中部署,也可以通過(guò)Amazon Bedrock自定義導(dǎo)入功能或Amazon EC2 Trn1實(shí)例中部署DeepSeek-R1-Distill系列模型。

一、云端部署:靈活可擴(kuò)展,與豐富服務(wù)無(wú)縫集成

相比本地部署,云端部署的優(yōu)勢(shì)是算力資源更充足,而且靈活可擴(kuò)展。同時(shí)在云端部署能夠與豐富且成熟的分析、數(shù)據(jù)等基礎(chǔ)服務(wù)進(jìn)行無(wú)縫集成。作為全球云計(jì)算的開(kāi)創(chuàng)者,亞馬遜云科技近20年來(lái)積累了深厚的技術(shù)根基,引領(lǐng)了一代代的云端基礎(chǔ)設(shè)施創(chuàng)新,在提高算力利用率、加速模型開(kāi)發(fā)等方面都有長(zhǎng)期經(jīng)驗(yàn)。

比如在自研芯片領(lǐng)域,亞馬遜云科技推出了基于Amazon Trainium2的EC2 Trn2實(shí)例,性價(jià)比比當(dāng)時(shí)GPU實(shí)例高30%-40%。還有第二代的UltraCluster網(wǎng)絡(luò)架構(gòu),支持超過(guò)20000個(gè)GPU協(xié)同工作,帶寬達(dá)10Pb/s,延遲低于10ms,這一升級(jí)能夠?qū)⒛P陀?xùn)練時(shí)間縮短至少15%。

亞馬遜云科技推出的新一代Amazon SageMaker,將快速SQL分析、PB級(jí)大數(shù)據(jù)處理、數(shù)據(jù)探索和集成、模型開(kāi)發(fā)和訓(xùn)練以及生成式AI等功能統(tǒng)一到一個(gè)集成平臺(tái),從而為客戶提供一個(gè)單一的數(shù)據(jù)和AI開(kāi)發(fā)環(huán)境,用戶可以在其中查找和訪問(wèn)其組織中的所有數(shù)據(jù),為各種常見(jiàn)的數(shù)據(jù)用例選擇最佳工具,并將數(shù)據(jù)和AI項(xiàng)目擴(kuò)展至團(tuán)隊(duì)內(nèi)不同分工角色以實(shí)現(xiàn)協(xié)作。

亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建談道,亞馬遜云科技不僅在云的核心服務(wù)層面持續(xù)創(chuàng)新,更在從芯片到模型,再到應(yīng)用的每一個(gè)技術(shù)堆棧取得突破,讓不同層級(jí)的創(chuàng)新相互賦能、協(xié)同進(jìn)化。

他相信只有這樣全棧聯(lián)動(dòng)的大規(guī)模創(chuàng)新,才能真正滿足當(dāng)今客戶的發(fā)展需求,加速前沿技術(shù)的價(jià)值釋放。

二、多樣化模型選擇,按需組出性價(jià)比

跟其他云服務(wù)大廠相比,亞馬遜云科技生成式AI服務(wù)的一大特色,就是模型選擇多。

基于“不會(huì)有一個(gè)模型一統(tǒng)天下”的判斷,亞馬遜云科技在自研大模型的同時(shí),也將來(lái)自不同企業(yè)、不同功能的領(lǐng)先大模型匯聚在一起,放到云中的“大模型貨架”上,供客戶按需實(shí)現(xiàn)最具性價(jià)比的組合。

在實(shí)際構(gòu)建生成式AI應(yīng)用時(shí),不同應(yīng)用場(chǎng)景需要的性能、成本、響應(yīng)速度、微調(diào)能力、知識(shí)庫(kù)協(xié)調(diào)能力、多模態(tài)支持能力等技術(shù)指標(biāo)各不相同。比如在快速響應(yīng)場(chǎng)景,需要花一些時(shí)間推理的DeepSeek R1深層思考模式就不太適用,其生成首個(gè)token的用時(shí)可能要超過(guò)30秒;而Amazon Nova模型的響應(yīng)就非常快,只耗時(shí)數(shù)百毫秒。

此前其“大模型貨架”上已經(jīng)有來(lái)自AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI和poolside等知名廠商的大模型。亞馬遜云科技還在不斷擴(kuò)展其模型“朋友圈”。

比如上個(gè)月Amazon Bedrock平臺(tái)剛剛上線了Luma AI的最新版視頻生成模型Ray 2模型,可以廣泛用于內(nèi)容創(chuàng)建、娛樂(lè)、廣告和媒體使用案例,從而簡(jiǎn)化從概念到執(zhí)行的創(chuàng)意流程。

亞馬遜云科技的Amazon Bedrock Marketplace功能為客戶提供100多個(gè)熱門、新興及專業(yè)模型,DeepSeek-R1就包含在內(nèi)。

怎么用DeepSeek高效開(kāi)發(fā)應(yīng)用?解讀亞馬遜云科技三大秘籍▲在Amazon SageMaker Jumpstart中快速部署DeepSeek模型

三、企業(yè)級(jí)AI工具全家桶:從性能提升到復(fù)雜多智能體編排

選擇合適的模型,下一步是如何高效解決工程化難題。

Amazon Bedrock聚焦企業(yè)應(yīng)用AI的實(shí)際需求,提供了企業(yè)AI工具全家桶,涉及模型從原型走向企業(yè)化生產(chǎn)環(huán)境時(shí)必須要考慮的方方面面的工具,以便開(kāi)發(fā)者基于領(lǐng)先模型來(lái)快速構(gòu)建應(yīng)用。

例如DeepSeek模型有不同參數(shù)量,小至幾十億,多達(dá)6710億。要實(shí)現(xiàn)完整部署R1并實(shí)現(xiàn)盡可能好的推理和響應(yīng),需要如Amazon EC2 P5e性能級(jí)別的硬件和配套的便捷工具。

怎么用DeepSeek高效開(kāi)發(fā)應(yīng)用?解讀亞馬遜云科技三大秘籍▲通過(guò)Amazon Bedrock Marketplace部署DeepSeek-R1,可選實(shí)例包括EC2 P5e的48xlarge型號(hào),單個(gè)實(shí)例包含8顆H200 GPU,以及3200Gbps的網(wǎng)絡(luò)帶寬,充分滿足DeepSeek-R1的性能需求

亞馬遜云科技提供的實(shí)用工具有助于優(yōu)化成本、根據(jù)自有數(shù)據(jù)定制提升準(zhǔn)確性、安全性以及針對(duì)未來(lái)復(fù)雜的多智能體構(gòu)建和管理等。可以簡(jiǎn)要概括為以下4類:

1、優(yōu)化效果、延遲和成本:如低延遲優(yōu)化推理、模型蒸餾、提示詞緩存等功能,大幅提升推理效率。其中模型蒸餾功能可將特定知識(shí)從功能強(qiáng)大的大模型轉(zhuǎn)移到更小更高效的模型,運(yùn)行速度最快可提高500%,成本降低75%。

2、基于企業(yè)自有數(shù)據(jù)的定制優(yōu)化:模型微調(diào)功能、知識(shí)庫(kù)功能不斷豐富,現(xiàn)已支持GraphRAG等圖數(shù)據(jù),能夠快速且經(jīng)濟(jì)高效地從文檔、圖像、音頻以及視頻中提取信息,并將其轉(zhuǎn)換為結(jié)構(gòu)化格式的Amazon Bedrock Data Automation功能等。

3、負(fù)責(zé)任AI的安全和審查:Amazon Bedrock不斷豐富其護(hù)欄功能,以簡(jiǎn)化企業(yè)實(shí)施負(fù)責(zé)任AI所需的投入,例如為其加入自動(dòng)推理檢查功能,從而能夠輕松識(shí)別事實(shí)性錯(cuò)誤,以提升生成回答的準(zhǔn)確性。

4、實(shí)現(xiàn)復(fù)雜功能的多智能體功能:Amazon Bedrock不但提供智能體功能,還進(jìn)一步推出了多智能體協(xié)作功能,使客戶能夠輕松地構(gòu)建和協(xié)調(diào)專業(yè)智能體來(lái)執(zhí)行復(fù)雜的工作流程??蛻艨梢酝ㄟ^(guò)為項(xiàng)目的特定步驟創(chuàng)建和分配專用智能體,獲得更準(zhǔn)確的結(jié)果并加速任務(wù)。

怎么用DeepSeek高效開(kāi)發(fā)應(yīng)用?解讀亞馬遜云科技三大秘籍

▲在Amazon Bedrock模型定制頁(yè)面部署DeepSeek 88Llama Model

結(jié)語(yǔ):用全棧式創(chuàng)新托舉企業(yè)級(jí)AI構(gòu)建

在2024 re:Invent上,亞馬遜CEO Andy Jassy曾分享亞馬遜自身部署AI中的三項(xiàng)關(guān)鍵洞察:首先,隨著生成式AI應(yīng)用規(guī)模的擴(kuò)大,計(jì)算成本變得至關(guān)重要;人們非常渴望獲得更高的性價(jià)比;其次,構(gòu)建一個(gè)真正優(yōu)秀的生成式AI應(yīng)用非常困難;第三,永遠(yuǎn)不會(huì)有單一的工具能夠統(tǒng)治世界,要提供多樣化的模型,讓開(kāi)發(fā)者自由選擇。

亞馬遜云科技在云端部署方面的靈活可擴(kuò)展性、多樣化模型選擇以及實(shí)用工具的提供,則無(wú)一不是對(duì)這些洞察的有力回應(yīng)。

通過(guò)上述三大優(yōu)勢(shì),亞馬遜云科技正在幫助企業(yè)更快更好地運(yùn)用領(lǐng)先的模型。亞馬遜云科技對(duì)DeepSeek的積極擁抱,也在踐行其此前向客戶所承諾的——托管最流行的、具有創(chuàng)新性的AI模型。隨著DeepSeek催化開(kāi)源風(fēng)暴,未來(lái)我們將看到更多優(yōu)質(zhì)新模型的誕生,而無(wú)論模型種類如何繁多,亞馬遜云科技的全棧式創(chuàng)新都形成穩(wěn)固的托舉。