限制人工智能潛力的主要基礎設施挑戰
數字房地產公司Interxion的營銷和業務總監PatrickLastennet審視了人工智能創新加速所面臨的障礙。其認為,從一開始就為AI部署制定強大的基礎設施戰略非常重要。
人們對人工智能的需求正在增長。每個行業的企業都在探索如何利用人工智能加速創新,并提供強大的競爭優勢。然而,設計人工智能基礎設施是復雜且難以承受的,因此,76%的企業認為基礎設施是人工智能成功的障礙。
不過,這不是放慢進展的借口。隨著越來越多的企業積極追求或至少落后于人工智能,那些等待的企業只會更加落后。
最近一項針對8個歐洲國家IT決策者的調查發現,近三分之二的企業(62%)目前正在部署或測試AI,另有17%計劃在2020年使用AI。
受訪者指出,許多基礎設施障礙限制了人工智能的大規模部署,從缺乏資源,如資金、人員和物理基礎設施,到不明確的企業戰略沒有考慮到人工智能。
由于人工智能部署對于許多企業來說是一個緩慢的構建過程,因此在已進入部署階段的企業和尚未開始規劃的企業之間將形成巨大的技術差距。不愿投資人工智能的企業將錯失獲得競爭優勢的機會。
這就是為什么從一開始就為AI部署制定一個強大的基礎設施戰略,這非常重要。以下是需要考慮的問題。
成功的障礙
通常,領先重大AI研發的公司都沒有來自IT部門的重要初始投入。結果,團隊不幸地產生了影子AI——在IT的雷達下創建的AI基礎設施,這是成功操作的挑戰,最終是無效的。企業可以通過制定專門針對AI優化的基礎設施戰略來避免影子AI。
調查強調,不可估量的成本是首要問題(21%)。從對人員和設備的新投資需求,到人工智能設計和部署之間曲折道路上不可預見的成本,再到技術需求的快速創新和轉變,人工智能投資可能是巨大的,很難預測。此外,如果企業未能部署該技術,IT和AI開發之間的內部脫節會導致低投資回報率。
缺乏內部專家人員也是一個重大挑戰。企業通常需要聘請專業的開發人員,這可能成本高昂,且需要時間讓新員工學習業務,以滿足AI設計和組織目標。
IT設備的不足也阻礙了企業設想人工智能如何融入其運營。根據這項調查,許多企業擔心其目前的基礎設施沒有優化到支持人工智能的程度,并擔心數據中心已達到滿負荷運轉。
戰略階段的障礙在各行業中基本相似,但具體的基礎設施決策可能因行業而異。法律或合規要求,如GDPR,以及涉及的數據類型和工作流程,都將影響AI基礎設施決策。
該研究發現,39%的跨行業企業使用主要的公共云——其中大多數是尋求靈活性和高速的制造商。與此同時,29%的受訪者更傾向于獲得顧問支持的內部解決方案——通常是金融、能源和醫療保健公司,這些企業希望將其個人身份信息(PII)數據置于嚴密的安全和更好的控制之下。
成功的人工智能基礎設施的要素
由于許多企業都是從零開始,所以從一開始就制定明確的戰略是非常必要的,因為之后重新架構會花費大量的時間、金錢和資源。要成功地大規模啟用人工智能,企業需要檢查幾個方面。
首先,企業需要能夠確保其擁有正確的基礎架構,以支持為AI工作負載準備的數據集所需的數據采集和收集。特別是,必須注意從AI推理運行的邊緣或云設備收集數據的有效性和成本。理想情況下,這需要在全球多個地區實現,同時利用高速連接并確保高可用性。這意味著企業需要可提供以下優勢的網絡結構支持的基礎架構:
接近AI數據:企業數據中心的5G和固定線路核心節點將來自現場設備、辦公室和制造設施的AI數據帶入區域互聯數據中心,以沿著多節點架構進行處理。
直接云訪問: 提供對云超規模環境的高性能訪問,以支持人工智能訓練或推理工作負載的混合部署。
地理規模:通過將其基礎設施置于位于戰略地理區域的多個數據中心,企業可以在全球范圍內實現低成本的數據獲取和高性能的AI工作負載交付。
當企業考慮訓練人工智能/深度學習模型時,必須考慮一個數據中心合作伙伴,該合作伙伴能夠在長期內適應支持GPU加速計算的必要電源和冷卻技術,這需要:
高機架密度:為了支持AI工作負載,企業需要從其數據中心的每個機架獲得更多的計算能力。這意味著更高的功率密度。事實上,大多數企業需要將其最大密度至少擴大三倍,以支持AI工作負載,并為未來更高的級別做好準備。
數量和規模:利用人工智能優勢的關鍵是大規模實施。在大規模硬件(GPU)上運行的能力能夠實現大規模計算的效果。
通往人工智能的現實之路
大多數本地企業數據中心無法處理這種規模的數據。與此同時,公共云提供了阻力最小的路徑,但由于高成本或延遲問題,其并不總是大規模訓練AI模型,或將其部署到生產環境的最佳環境。
那么,對于那些想要設計支持AI工作負載的基礎設施的企業而言,最好的方法是什么呢?通過研究已經從人工智能中獲得價值的企業如何選擇部署其基礎設施,可吸取重要的經驗教訓。
Google、Amazon、Facebook和Microsoft等超大規模企業成功地利用自己的核心和邊緣基礎設施大規模部署了人工智能,這些基礎設施通常部署在高度連接的高質量數據中心。他們在全球大量使用托管,因為他們知道托管可以支持其所需的規模、高密度和連接性。
通過利用這些人工智能領導者的知識和經驗,企業將能夠在人工智能方面規劃自己的命運。