4月23日消息,就在上周,亞馬遜云科技最新推出了生成式AI(AIGC)工具Amazon Bedrock、Amazon Titan基礎模型,并向個人開發者免費開放AI編程工具Amazon CodeWhisperer等等。
從OpenAI推出ChatGPT起,到國內百度、阿里等廠商陸續推出AIGC產品,國內外大型語言模型(LLM)概念和產品大熱,大廠間的競爭如火如荼。此番,亞馬遜云科技在生成式AI領域一口氣推出多項新服務,自然引發業內人士關注。
新推出的生成式AI工具Amazon Bedrock有哪些能力?它和目前市面上的AIGC產品定位有何不同?
企業用戶能如何使用Amazon Bedrock來滿足自身的AIGC服務需求?
和亞馬遜云科技的機器學習神器Amazon SageMaker相比,Amazon Bedrock的服務側重點在哪兒,二者能如何協調?……
帶著這樣一些問題,TechWeb同亞馬遜云科技相關技術團隊人員進行了交流,以期理清上述問題。
1、新推出的生成式AI工具Amazon Bedrock有哪些能力?怎么用?
此次亞馬遜云科技推出的Amazon Titan基礎模型包括兩個全新的大語言模型:
第一個是針對總結、文本生成(如原創博客)、分類、開放式問答和信息提取等任務的生成式大語言模型;
第二個是文本嵌入(embeddings)大語言模型,能夠將文本輸入(字詞、短語甚至是大篇幅文章)翻譯成包含語義的數字表達(即embeddings 嵌入編碼)。
Amazon Bedrock這項新服務是一項全新的全托管服務,它允許用戶通過API訪問亞馬遜云科技和第三方基礎模型提供商的預訓練基礎模型(Foundation model)
目前,Amazon Bedrock支持API訪問的基礎模型共有5款,分別是來自AI21 Labs、Anthropic、Stability AI這3家第三方合作伙伴的基礎模型,以及亞馬遜新發布的Amazon Titan的2款基礎模型。
提醒一下,Stability AI就是目前在全球非常火爆的AI繪畫工具Stable Diffusion的公司。該公司推出了開源AIGC模型Stable Diffusion。利用這一模型,即便是完全不具備繪畫能力的人,只需要提供一段文字描述,就可以創作出精妙絕倫的繪畫作品。Stable Diffusion自2022年8月推出以來,已經被全球超過20萬開發者下載和授權,也受到國內開發者的廣泛追捧。
亞馬遜云科技大中華區產品部總經理陳曉建表示,Amazon Bedrock是客戶使用基礎模型構建和擴展生成式AI應用程序的最簡單方法,降低了所有開發者的使用門檻。
陳曉建認為Amazon Bedrock具備五個特點:
一、全托管的體驗:Bedrock通過API提供無服務器的托管體驗,客戶無需擔心實例類型、網絡拓撲和端點等基礎設施細節。
二、輕松定制:客戶只要在Amazon S3中提供少量(低至20個)帶標簽的示例,就可以輕松定制Bedrock的基礎模型,用于其特定用例。
三、以隱私思維構建:用于模型微調的客戶專有數據不會用于訓練基礎模型,確保客戶的工作成果不會讓其它客戶(包括競爭對手)受益。
四、Amazon Titan基礎模型:Bedrock可以獨家訪問亞馬遜云科技開發的最先進基礎模型。
五、客戶選擇權:客戶可以在亞馬遜云科技和第三方合作伙伴的多個不同基礎模型之間進行選擇,這些基礎模型都可以進一步定制以支持其特定用例。
2、Amazon Bedrock vs Amazon SageMaker? 還是 Amazon Bedrock & Amazon SageMaker?
事實上,亞馬遜云科技旗下的人工智能(AI)和機器學習(ML)服務Amazon SageMaker已經為AI開發人員所熟悉。
2017年,在亞馬遜云科技 re:Invent 全球大會上,Amazon SageMaker首次亮相。Amazon SageMaker推出了全球首個用于機器學習的集成開發環境(IDE),它使得不論是開發人員、數據科學家、還是商業分析師都能夠快速、輕松地準備數據,并在規模上構建、訓練和部署高質量的機器學習模型,大大降低了機器學習的使用門檻。
那么,這次亞馬遜云科技推出的AIGC工具Amazon Bedrock和Amazon SageMaker之間是一種什么關系呢?
對此,亞馬遜云科技大中華區數據技術專家團隊總監王曉野向TechWeb介紹道:
Amazon Bedrock和Amazon Sagemaker是兩個獨立的服務。
Amazon SageMaker是端到端的機器學習平臺,它的功能包括從數據標注到數據訓練、再到部署、上線以后的持續監控以及基于原始數據的再迭代等端到端的能力。在生成式AI大模型出現之前,它就已經非常成熟的在幫助客戶解決問題了。
Amazon Bedrock的定位是要解決以下幾個核心的問題:
一是能幫客戶快速找到行業領先模型,并通過API的方式盡可能的不用客戶自己去管理底層硬件和運維即可訪問。
二是,用戶采用Amazon Bedrock做模型調優和訓練的時候,和使用Amazon SageMaker的區別是,Amazon SageMaker首先是面向數據科學家,需要編寫代碼并提供數據以及添加參數去做模型和調優。從應用形式上,在Bedrock里面,客戶只需要提供20個已經標注好的數據,就可以很快展開,不需要編寫太多的代碼。
另外,在部署集成方面,Amazon SageMaker和Bedrock還有一些結合點。事實上SageMaker的某些功能可以被復用到Bedrock訓練出來的模型上面。比如客戶通過Bedrock自己定制了一個模型出來,新的模型在應用的時候,模型管理的流程是可以互通的。客戶可以將基礎模型與 Amazon SageMaker 機器學習功能集成,使用 Experiments 測試不同模型和使用Pipelines 大規模管理基礎模型等等。
王曉野總結認為,二者基本的區分如果畫一下用戶畫像的話,SageMaker是針對專業人員,Bedrock是盡可能降低門檻,讓偏向于行業的場景用戶能夠更好的用起來。
陳曉建補充道,Bedrock作為一個新的、生成式AI的生產工具,依托于現有的五個已經預設的基礎模型,通過API直接調用,生成更多的內容。 Amazon SageMaker是全方位的、全功能化的機器學習工具,包括數據標注到訓練到推理,整個能力都是具備的,同時它也有一些預設的能力。你可以根據需要選擇適用的場景。
也就是說,Bedrock只是在生成式AI領域,Amazon SageMaker是針對所有機器學習和人工智能領域。生成式AI只是AI的一部分,而Amazon SageMaker是面向整個AI/ML的。
3、亞馬遜云科技如何定位自己的AICG產品和服務?
陳曉建表示,在人工智能、機器學習和堆棧這三個層級,亞馬遜云科技都擁有非常多的產品組合,我們一直利用人工智能和機器學習技術賦能千行百業。
這次在生成式AI領域發布多項新服務,陳曉建稱,亞馬遜云科技同樣致力于推動技術的普惠化:希望將生成式AI技術從研究和實驗領域釋放出來,不只讓少數初創公司和資金雄厚的大型科技公司,而是讓更多公司都能從中受益。我們的使命是讓各種技能水平的開發人員和各種規模的組織都有機會使用生成式 AI 進行創新。
談及“普惠”,陳曉建舉例稱,此次除了推出AIGC具體產品和服務Amazon Bedrock和Amazon Titan基礎模型外,亞馬遜云科技還宣布基于Amazon Trainium芯片的新型Trn1n實例正式可用,該實例將網絡帶寬提高了一倍,為訓練生成式AI模型提供了更高的性能。同時,基于AI的編程助手Amazon CodeWhisperer正式可用,個人開發者可以免費訪問Amazon CodeWhisperer,且沒有任何使用限制。
“我們相信,機器學習的新浪潮才剛開始,未來充滿了無限的可能,亞馬遜云科技也希望能夠在這個方面為客戶創造更多的價值。”陳曉建強調。