成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

第四范式推出業界首個基于持久內存、支持毫秒級恢復的萬億維線上預估系統

新聞
為進一步滿足企業線上預估需求,第四范式定制開發了基于持久內存技術、支持實時恢復的萬億維線上預估系統,為企業提供高可用性、毫秒級恢復的在線預估服務,同時將企業總擁有成本降低80%。

線上預估服務是AI在企業應用落地的關鍵環節,企業通常會采用分布式計算架構在內存中完成實時數據處理和高達萬億維的模型特征存儲,并通過多集群副本解決傳統純內存(DRAM)天生的易“失”性隱患,以達到線上實時服務質量(Quality of Service)效果。然而,隨著企業AI應用模型大小和數量的增長,線上預估服務所需要的硬件資源也呈幾何倍數增加。

為進一步滿足企業線上預估需求,第四范式定制開發了基于持久內存技術、支持實時恢復的萬億維線上預估系統,為企業提供高可用性、毫秒級恢復的在線預估服務,同時將企業總擁有成本降低80%。該系統基于第四范式AI算力平臺SageOne的持久內存進行了軟硬一體設計,與其他預估系統相比,可實現每秒億級KV查詢的高性能,并能夠與第四范式自研的高維機器學習框架以及TensorFlow等AI開源框架無縫對接。保證了在線預估服務無論在發生物理故障或者程序崩潰的情況下,均具備毫秒級故障實時恢復特性,是企業低成本實現高可用AI線上預估服務的最佳選擇。

第四范式自研的基于持久內存的萬億維級參數服務器 – HyperPS是該線上預估系統的關鍵基礎組件。HyperPS參數服務器具備高性能底層序列化框架、鏈路共享、多級訪存優化、雙端參數合并及動態擴縮容等特性。基于持久內存設計和優化后,HyperPS在保持與基于純內存參數服務器幾乎一致性能的同時,展現出在線上預估應用中數據實時恢復和應用成本低的巨大優勢。

持久內存加持 參數服務器性能升級

參數服務器通常將所有數據放在純內存中處理,AI模型越大,分布式參數服務器的內存需求越大。此外,純內存雖然性能優秀,但因其易失性(volatile)特性,一旦硬件或者軟件發生故障,內存丟失的全部數據必須從持久性存儲設備(HDD/SSD)中讀取日志恢復,恢復速度慢,嚴重影響線上性能服務質量。

持久內存的大容量、高性能、非易失性屬性,為其帶來了高安全性、低成本等優勢,改善了目前純內存容量小、成本高、災備恢復慢等問題。針對持久內存這些應用優點,第四范式針對HyperPS參數服務器的底層系統架構和存取性能等進行了軟硬一體設計。首先,針對節點內的shard重新設計了新的存儲引擎,采用持久化哈希表為底層數據結構儲存特征,保證高并行度性能的同時,對持久內存數據組織格式進行優化,達到接近于純內存哈希表的性能;其次,對參數服務器災難恢復機制調優,使用持久化智能指針記錄哈希表的核心數據結構和根指針,實現業界首創的參數服務器實時恢復能力;再次,利用PMDK的transaction機制,使用pmempool分配和管理持久內存空間,確保持久內存數據一致性;最后,針對影響性能的持久化操作進行策略性的降低,進一步提高性能。

在實際測試環境中,基于持久內存的HyperPS表現出更低的擁有成本和巨大的實時恢復優勢,以及與純內存近乎一致的性能表現。

01. 企業AI應用內存預估:

AI為企業帶來出眾的業務效果,同時企業也要承擔AI產生的成本壓力,特別是當AI規模化應用時。以某著名手機終端廠商為例,分別采用配備384GB 純內存服務器和配備2TB持久內存的服務器為預估單節點基準。每上線一個模型在在純內存的參數服務器上占用內存空間大概是128GB。基于持久內存的數據結構由于其有額外的持久化邏輯,在空間復雜度上會略高于純內存數據結構,其空間占用大概是204GB。在此基礎上,估算企業上線1-100個模型參數服務器所需的純內存物理節點數和配備持久內存的物理節點數量。

從預估結果來看,企業需要采用持久內存的物理節點數量和純內存的物理節點數量比為1:3.4-4,而持久內存的參數服務器總成本最多下降80%。

02. 數據恢復速度測試:

當系統節點出現故障時,采用純內存的參數服務器需要從數據存儲集群(如HDFS)重新申請模型參數數據恢復,耗時長,嚴重影響線上服務質量。采用持久內存的HyperPS則完全不同,節點發生故障或者程序崩潰后,數據依然保存在持久內存中,服務重啟后只需要調用優化過的數據一致性檢查函數,即可實現毫秒級實時恢復。

以恢復6千萬維參數模型為例,純內存參數服務器恢復模型需要花費58秒,而持久性內存參數服務器只需要0.03秒,故障恢復時長縮短將近2000倍。

 

恢復20個模型總計12億維參數測試中,純內存參數服務器數據恢復時間隨著數據總量增加而大幅增長,而持久內存的參數服務器幾乎沒有受到影響,只需檢查哈希表元數據后即可提供服務,其恢復時長縮短17114倍。

03. 預估性能測試:

HyperPS不僅大幅降低了總擁有成本并提升數據恢復速度,也展現出和純內存模式下同水準的性能表現。在非高壓(1個請求線程)和高壓(56個并發請求線程)的情況下的請求延遲(TP99)。結果表明,基于持久內存的HyperPS參數服務器在延遲上,與采用純內存的參數服務器性能相近。單線程和56線程兩個測試中,持久內存的參數服務器均僅比采用純內存的參數服務器延遲多1毫秒。

在吞吐性能對比測試項目中,基于持久內存的參數服務器在56線程的高壓負載測試中的QPS僅比純內存參數服務器低3.5%。

此次,通過 “軟件定義算力”的全新方式,第四范式將自研HyperPS萬億維參數服務器與英特爾®傲騰™持久內存進行軟硬一體優化設計,保證線上推理服務超高性能的同時,大幅降低企業AI整體投入成本,提升線上服務質量,進一步掃清了企業AI規模化應用的前進障礙。

責任編輯:王雪燕 來源: 51CTO
相關推薦

2017-10-24 11:48:04

思科服務組合

2009-04-22 10:14:09

VMwarevSphere 4

2022-10-19 16:51:10

Linux優化

2009-08-03 16:37:18

OLT方案FTTx網絡接入華為

2013-11-25 11:01:42

2015-10-19 18:00:21

SDNONFPoC

2015-07-30 10:46:50

2011-07-20 16:31:35

思科以太網

2011-09-19 17:44:23

Connections社交商務

2020-05-15 12:27:33

RPA人工智能

2021-01-18 11:46:28

漏洞惡意軟件Malvuln

2009-03-19 10:04:20

思科數據中心產品

2011-02-15 11:06:20

賽門鐵克SSL證書

2011-08-18 10:12:17

IPv6

2021-12-31 11:42:42

華為云軟通動力RPA

2009-02-02 15:34:36

Arkeia備份虛擬備份

2009-02-03 09:44:00

服務器虛擬化Arkeia Soft

2012-11-16 15:12:43

光纖博科戴爾

2011-04-14 09:49:16

Novell企業級LinuxSUSE

2018-06-28 15:55:31

思科
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美1区| 日产久久 | 手机在线观看av | 亚洲久久 | 久久精品一区 | 成年人免费看的视频 | 欧美老少妇一级特黄一片 | 久久精品成人 | 国产高清久久久 | 亚洲成年影院 | 日本久久www成人免 成人久久久久 | 无码国模国产在线观看 | 国产精品综合色区在线观看 | 久久精品亚洲精品国产欧美 | 91国内精品 | 国内精品久久影院 | 黄色一级免费 | 亚洲欧美一区二区三区国产精品 | 欧美一级在线视频 | 国产成人99久久亚洲综合精品 | 激情影院久久 | 日韩欧美中文 | а_天堂中文最新版地址 | 91色视频在线观看 | 综合色婷婷 | 国产成人99久久亚洲综合精品 | 亚洲国产精品久久 | 精品国产青草久久久久福利 | 又黄又爽的网站 | 国产精品久久久久久久久久久免费看 | 久久久久九九九女人毛片 | 最新av片 | 久草色视频 | 国产h视频 | 亚洲一区不卡在线 | 欧美激情一区二区 | 成人字幕网zmw | 国产精品久久久久久久一区探花 | 国产精品久久国产精品 | 日本特黄特色aaa大片免费 | 亚洲国产精品日韩av不卡在线 |