AWS發(fā)布三項全新的Amazon AI服務(wù)
- Amazon Lex,支持Amazon Alexa的技術(shù),讓任何開發(fā)者都能為web、移動和互聯(lián)設(shè)備應(yīng)用構(gòu)建豐富的、對話式的用戶體驗。
- Amazon Polly可將文本轉(zhuǎn)化成生動傳神的談話,讓應(yīng)用能以47種逼真的聲音、24種語言對話。
- Amazon Rekognition可輕松添加圖像分析至應(yīng)用,使用強大的、基于深度學(xué)習(xí)的圖像和面部識別。
- Capital One, Motorola Solutions, SmugMug, American Heart Association, NASA, HubSpot, Redfin, Ohio Health, DuoLingo, Royal National Institute of Blind People, LingApps, GoAnimate及Coursera,還有很多客戶都在使用這些Amazon AI服務(wù)。
美國西雅圖,2016年11月30日 ,亞馬遜旗下公司Amazon Web Services, Inc.(AWS)發(fā)布三項人工智能(AI)服務(wù),讓任何開發(fā)者都能輕松構(gòu)建理解自然語言的應(yīng)用程序,將文本變成生動的言語,使用聲音或文本進行對話,分析圖像并識別人臉、物體和場景。Amazon Lex、Amazon Polly和Amazon Rekognition都基于同樣經(jīng)驗證的、高可擴展的Amazon技術(shù),由全公司數(shù)千名深度學(xué)習(xí)和機器學(xué)習(xí)專家打造。Amazon AI服務(wù)全都提供高質(zhì)量、高精度的AI能力,可擴展且經(jīng)濟高效。Amazon AI服務(wù)是完全托管的服務(wù),因此無需構(gòu)建深度學(xué)習(xí)算法,無需訓(xùn)練機器學(xué)習(xí)模型,無需前期承諾或基礎(chǔ)設(shè)施投資。這解放了開發(fā)者,讓他們能專注于定義并構(gòu)建全新一代的應(yīng)用,這些程序能看到、聽到、說、理解并與周圍的世界互動。要了解有關(guān)Amazon Lex,Amazon Polly或Amazon Rekognition的更多信息,請訪問:https://aws.amazon.com/amazon-ai
到目前為止,很少有開發(fā)人員能構(gòu)建、部署并大規(guī)模擴展具備AI能力的應(yīng)用程序,因為這樣做需要訪問大量數(shù)據(jù),以及機器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)方面的專業(yè)知識。有效地應(yīng)用AI涉及大量手動操作,以開發(fā)并調(diào)整許多不同類型的機器學(xué)習(xí)和深度學(xué)習(xí)算法(例如自動語音識別、自然語言理解、圖像分類),收集清理訓(xùn)練數(shù)據(jù),訓(xùn)練并調(diào)整機器學(xué)習(xí)模型。并且,這一過程必須對應(yīng)用程序中的每個對象、面部、語音和語言特性重復(fù)。Amazon AI服務(wù)消除了所有這些繁重的工作,讓AI可以為所有應(yīng)用程序開發(fā)人員廣泛地訪問,提供Amazon強大且可靠的深度學(xué)習(xí)算法和技術(shù),以任何開發(fā)人員可通過API調(diào)用或在AWS管理控制臺點擊幾次即可達成的完全托管服務(wù)形式呈現(xiàn)。Amazon AI服務(wù)完全釋放了Amazon的自然語言理解、語音識別、文本到語音和圖像分析技術(shù)能力,任意規(guī)模、任意應(yīng)用程序、任意設(shè)備,在任何地方。
“更好的算法、對大量數(shù)據(jù)的廣泛訪問以及由云提供的高效經(jīng)濟的計算能力,三者結(jié)合,使得AI成為應(yīng)用程序開發(fā)人員的現(xiàn)實。AWS是目前使用的一些極具創(chuàng)新性和創(chuàng)造性的AI應(yīng)用程序的家,”AWS數(shù)據(jù)庫、分析和AI副總裁Raju Gulabani說:“多年來,Amazon成千上萬的機器學(xué)習(xí)和深度學(xué)習(xí)專家一直在開發(fā)人工智能技術(shù),以預(yù)測顧客可能喜歡閱讀什么,通過機器人技術(shù)和計算機視覺技術(shù)提高我們物流中心的效率,并帶給客戶我們AI支持的虛擬助理Alexa。現(xiàn)在,我們正將這些創(chuàng)新的基礎(chǔ)技術(shù)以任何開發(fā)人員都可用的形式提供,包括三種易于使用、功能強大且高效經(jīng)濟的完全托管的Amazon AI服務(wù)。我們很興奮看到客戶如何使用Amazon Lex、Amazon Polly和Amazon Rekognition,構(gòu)建新一代的應(yīng)用程序。這些應(yīng)用程序具有類似人類的智能,可以看到、聽到、說話,并與人和他們的環(huán)境進行交互。”
用Amazon Lex實現(xiàn)智能對話
Amazon Lex是一項新服務(wù),使用支持Amazon Alexa的、基于相同的自動語音識別(ASR)技術(shù)和自然語言理解(NLU)的語音和文本構(gòu)建對話界面。Amazon Lex可輕松將復(fù)雜的自然語言功能帶到幾乎任何應(yīng)用程序。開發(fā)人員可以通過輸入幾個示例短語(例如,“查找航班”或“預(yù)訂航班”),用于獲得完成任務(wù)所需參數(shù)(例如,旅行日期和目的地)的指令以及相應(yīng)的澄清問題以詢問用戶(例如,“你想什么時候旅行?”,“你想去哪里?),直接從AWS管理控制臺構(gòu)建和測試機器人(執(zhí)行自動化任務(wù)的會話應(yīng)用,如檢查天氣或預(yù)訂航班)。 Amazon Lex負責(zé)其余部分,構(gòu)建語言模型并詢問完成任務(wù)所需的后續(xù)問題。由于Amazon Lex是與AWS Lambda集成的,開發(fā)人員可以將Amazon Lex配置為通過AWS Lambda函數(shù)調(diào)用適當?shù)暮蠖朔?wù)(例如航班預(yù)訂服務(wù))。開發(fā)人員還可以使用執(zhí)行AWS Lambda函數(shù)的預(yù)構(gòu)建企業(yè)連接器,通過從Salesforce、Microsoft Dynamics、Marketo、Zendesk、QuickBooks和HubSpot等企業(yè)系統(tǒng)中獲取數(shù)據(jù)來回答諸如“我在Salesforce.com中的前十個帳戶是什么”這樣的問題。
使用Amazon Lex構(gòu)建的機器人可以在任何地方使用:從Web應(yīng)用程序,到Slack和Facebook Messenger等聊天和信使應(yīng)用程序,或通過移動或連接設(shè)備上的應(yīng)用程序中的語音。 Amazon Lex處理不同平臺所需的身份驗證,并通過不要求開發(fā)人員為每個平臺編寫自定義代碼來簡化用戶界面設(shè)計。 此外,開發(fā)人員不必擔心擴展其基礎(chǔ)架構(gòu),因為Amazon Lex會隨著流量增加而自動擴展,并且開發(fā)人員僅需對Amazon Lex API的調(diào)用進行支付。
Capital One通過各種渠道為消費者、小型企業(yè)和商業(yè)客戶提供廣泛的金融產(chǎn)品和服務(wù)。 Capital One實驗室首席技術(shù)官Firoze Lafeer表示:“作為AWS的資深用戶,Amazon Lex與其他AWS服務(wù)(如AWS Lambda和Amazon DynamoDB)的無縫集成非常吸引人。 一個高度可擴展的解決方案,Amazon Lex還帶來了加快新一代語音和文本交互上市速度的潛力,例如我們最近為Alexa推出的Capital One技術(shù)。”
OhioHealth是一個全國認可的醫(yī)療保健組織,在47個縣擁有11多家醫(yī)院的網(wǎng)絡(luò)。 “我們對利用不斷演進的語音識別和自然語言處理技術(shù)來改善客戶的生活感到很興奮。Amazon Lex為我們提供了一個很好的機會,帶給我們的病人一種新體驗。” OhioHealth運營支持高級副總裁兼首席信息官Michael Krouse表示:“我們在OhioHealth所做的一切都是為了在正確的時間和地點為我們的患者提供適當?shù)淖o理。Amazon Lex的下一代技術(shù)和我們正在開發(fā)的創(chuàng)新應(yīng)用程序,將有助于提供增強的客戶體驗。我們擁有無限可能。”
HubSpot是一個營銷和銷售軟件的領(lǐng)導(dǎo)者。“HubSpot的GrowthBot是一個一體化的聊天機器人,通過使用會話界面提供對相關(guān)數(shù)據(jù)和服務(wù)的訪問,幫助營銷人員和銷售人員提高工作效率。使用GrowthBot,營銷人員可在創(chuàng)建內(nèi)容、研究競爭對手并監(jiān)控其分析方面獲得幫助。通過Amazon Lex,我們添加了復(fù)雜的自然語言處理能力,幫助GrowthBot為我們的用戶提供更直觀的UI,“HubSpot創(chuàng)始人和首席技術(shù)官Dharmesh Shah表示:“Amazon Lex讓我們利用先進的AI和機器學(xué)習(xí),不必自己編寫算法。”
通過允許將實時通信和身份驗證功能直接嵌入軟件應(yīng)用程序,Twilio幫助企業(yè)實現(xiàn)通信相關(guān)并合乎語境。Twilio消息產(chǎn)品部總監(jiān)Benjamin Stein表示:“開發(fā)者和企業(yè)使用Twilio來構(gòu)建應(yīng)用程序,可以與世界各地的客戶進行溝通。Amazon Lex將為開發(fā)人員提供一個易于使用的模塊化架構(gòu)和全面的API,以支持在移動平臺上構(gòu)建和部署對話機器人。我們期待看到我們的客戶使用Twilio和Amazon Lex構(gòu)建的東西。”
用Amazon Polly實現(xiàn)智能語音
Amazon Polly使開發(fā)人員能夠輕松地向現(xiàn)有應(yīng)用程序(如新聞閱讀器和電子學(xué)習(xí)平臺)添加自然語音功能,或創(chuàng)建全新類別的語音功能產(chǎn)品(從移動應(yīng)用程序到設(shè)備和設(shè)備)。 Amazon Polly易于使用,開發(fā)人員可以使用SDK或從AWS管理控制臺中向Amazon Polly發(fā)送文本,Polly會立即返回可以直接播放或以標準音頻文件格式存儲的音頻流。47個逼真的聲音和24種語言的支持,開發(fā)人員可以選擇男性和女性的聲音與各種口音,使應(yīng)用程序面向全球用戶。Amazon Polly流暢的文本內(nèi)容發(fā)音意味著,應(yīng)用程序可跨多種文本格式,提供高質(zhì)量的語音輸出。Amazon Polly是可擴展的,即使在將大量文本轉(zhuǎn)換為語音時,也能夠快速返回高質(zhì)量的語音。使用Amazon Polly,開發(fā)人員只需為他們轉(zhuǎn)換的文本支付,并且可以緩存生成的語音,隨意重復(fù)播放,沒有任何次數(shù)限制。
華盛頓郵報是一家曾獲普利策獎的媒體和技術(shù)公司,每天出版超過1200個故事。“華盛頓郵報高級產(chǎn)品經(jīng)理Joseph Price說:“我們一直對提供我們故事的音頻版本感興趣,但發(fā)現(xiàn),現(xiàn)有的文本到語音解決方案相對于它們提供的語音質(zhì)量而言,不具備什么成本效益。 隨著Amazon Polly的到來和其高品質(zhì)的聲音,我們期待為讀者提供更豐富多樣的方式體驗我們的內(nèi)容。”
GoAnimate是一個基于云的動畫視頻創(chuàng)作平臺,旨在讓沒有動畫背景的商業(yè)人士快速、容易地創(chuàng)建動畫視頻。“Amazon Polly讓GoAnimate用戶能夠立刻為使用我們平臺創(chuàng)建的角色配音。這在現(xiàn)場解說難得或時間不允許的場景中尤其有幫助,例如開發(fā)一個多語言的視頻,或者是加快審批流程的預(yù)生產(chǎn)制作,”GoAnimate創(chuàng)始人兼首席執(zhí)行官Alvin Hung表示:“Amazon Polly的語音與我們豐富的前動畫資產(chǎn)無縫集成,鞏固了GoAnimate的易用性,在為我們的客戶帶來高效率的同時,加速產(chǎn)品上市。”
用Amazon Rekognition實現(xiàn)智能圖像分析
Amazon Rekognition可讓開發(fā)者快速、容易地構(gòu)建應(yīng)用程序,分析圖像,識別人臉、物體和場景。Amazon Rekognition使用深度學(xué)習(xí)技術(shù),自動確定物體或場景,例如汽車、寵物或家具,并提供一個置信度得分,讓開發(fā)者可以給圖像打標簽,這樣應(yīng)用程序使用者就可使用關(guān)鍵詞搜索特定的圖像。Amazon Rekognition可在圖像內(nèi)定位面部并探測屬性,例如是否在微笑,或眼睛是否是睜開的。Amazon Rekognition還支持先進的面部分析功能,例如面部對比和人臉搜索。使用Rekognition,開發(fā)者可構(gòu)建一個應(yīng)用,評估兩張圖像中的面部是來自同一個人的可能性,從而能夠近實時地根據(jù)參考照片驗證用戶。類似地,開發(fā)者可創(chuàng)建成百上千萬面部(在圖像中探測到)的集合,根據(jù)其參考圖像,在集合中搜索相似的面部。通過借助一個簡單、高效經(jīng)濟且可靠的AWS服務(wù)實現(xiàn)全面的圖像分類、探測和管理能力,Amazon Rekognition消除了開發(fā)和管理昂貴的圖像處理流程所需的復(fù)雜性和開銷。
Redfin是一個全方位服務(wù)的經(jīng)紀商,使用現(xiàn)代技術(shù)幫助人們買賣房子。“Redfin用戶喜歡在我們的網(wǎng)站和移動應(yīng)用程序上瀏覽房產(chǎn),我們希望讓用戶更容易篩選數(shù)億的列表和圖像。”Redfin大數(shù)據(jù)和分析總監(jiān)Yong Huang表示:“Amazon Rekognition可從圖像直接生成一組豐富的標簽。這使得構(gòu)建智能搜索功能相對簡單,幫助客戶根據(jù)他們的特定需求(如壁爐,院子或游泳池)發(fā)現(xiàn)房子。由于Rekognition是接受Amazon S3 URL的,因此可在探測物體、場景和人臉上節(jié)省大量時間,無需移動圖像。
SmugMug是一個每天為成百上千萬客戶存儲數(shù)十億張優(yōu)美照片的家,安全又美麗。 SmugMug創(chuàng)始人、首席執(zhí)行官和首席極客Don MacAskill說:“SmugMug的客戶希望花時間創(chuàng)造更多的回憶,而不是手動管理他們的照片收藏。Amazon Rekognition允許我們自動識別客戶的照片中的內(nèi)容,解鎖一大堆功能,允許他們和其訪客將更多時間放在享受生活和慶祝他們的照片上。”
基于AWS的深度學(xué)習(xí)和AI
Amazon Polly今天在美國東部(N. Virginia)、美國東部(Ohio)、美國西部(Oregon)和歐盟(Dublin)地區(qū)可用,并將在未來幾個月擴展到更多地區(qū)。 Amazon Rekognition在美國東部(N. Virginia)、美國西部(Oregon)和歐盟(Dublin)地區(qū)提供,并將在未來幾個月擴展到更多地區(qū)。客戶可以從今天開始注冊Amazon Lex預(yù)覽。
除了這些服務(wù),AWS最近宣布正在大力投資MXNet,一個開源的分布式深度學(xué)習(xí)框架,最初由卡內(nèi)基梅隆大學(xué)和其他頂尖大學(xué)開發(fā),貢獻代碼并改進開發(fā)人員體驗。 MXNet將使機器學(xué)習(xí)科學(xué)家能夠構(gòu)建可擴展的深度學(xué)習(xí)模型,從而大大減少其應(yīng)用的訓(xùn)練時間。有關(guān)AWS支持MXNet的更多信息,請訪問:http://www.allthingsdistributed.com/2016/11/mxnet-default-framework-deep-learning-aws.html。
AWS還使開發(fā)人員能夠輕松運行自己的深度學(xué)習(xí)和機器學(xué)習(xí)工作負載,在AWS之上構(gòu)建自己的AI平臺。Amazon Elastic Compute Cloud(Amazon EC2)具有廣泛的實例類型,并擁有包含大量內(nèi)存的GPU,是深度學(xué)習(xí)訓(xùn)練的理想選擇。P2實例在2016年9月推出,旨在面向大規(guī)模機器學(xué)習(xí)和深度學(xué)習(xí),具備高達8個NVIDIA Tesla K80加速器,每個都運行一對NVIDIDA GK210 GPU,有12 GiB的內(nèi)存和2,496個并行處理核心。并且,客戶可以使用AWS的深度學(xué)習(xí)AMI,其中包含六個預(yù)配置和預(yù)測試的深度學(xué)習(xí)框架,包括所有依賴項、Nvidia驅(qū)動程序和數(shù)據(jù)科學(xué)工具,如Jupyter和Anaconda。 此外,AWS CloudFormation模板可用于規(guī)模化的深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練,幾次點擊便可實現(xiàn)。