成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<cite id="s4w2q"></cite>

<li id="s4w2q"></li>

<li id="s4w2q"></li>

<sup id="s4w2q"><input id="s4w2q"></input></sup>
<rt id="s4w2q"><tr id="s4w2q"></tr></rt>

<code id="s4w2q"><tr id="s4w2q"></tr></code>

<code id="s4w2q"><tr id="s4w2q"></tr></code>

<abbr id="s4w2q"></abbr>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠(chǎng)商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線(xiàn)學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

【分布式計(jì)算】MapReduce的替代者-Parameter Server

2015-07-16 15:30:34

云計(jì)算分布式

隨著互聯(lián)網(wǎng)的發(fā)展，數(shù)據(jù)量的增大，很多對(duì)于數(shù)據(jù)的處理工都遷移到了云端,衍生了很多分布式計(jì)算的計(jì)算模型，比較著名的就是MapReduce、MPI、BSP等。后來(lái)也產(chǎn)生了一些分布式計(jì)算系統(tǒng)，大家耳熟能詳?shù)腍adoop就是基于 MapReduce實(shí)現(xiàn)的。本文的主人公是Parameter Server，其實(shí)也不算是新寵了，這個(gè)模型已經(jīng)被提出好幾年了，只不過(guò)在國(guó)內(nèi)還不是特別熱。不過(guò)最近一些云服務(wù)巨頭們開(kāi)始了對(duì)于PS的深入開(kāi)發(fā)和研究。

首先還是要聲明一下，這個(gè)文章是我在入職阿里云1個(gè)月以來(lái)，對(duì)于分布式計(jì)算的一點(diǎn)膚淺的認(rèn)識(shí)，可能有些地方不夠妥善，還請(qǐng)看官可以指出不足的地方，共同進(jìn)步。

一.背景

隨著互聯(lián)網(wǎng)的發(fā)展，數(shù)據(jù)量的增大，很多對(duì)于數(shù)據(jù)的處理工作(例如一些推薦系統(tǒng)、廣告推送等)都遷移到了云端，也就是分布式計(jì)算系統(tǒng)上。衍生了很多牛逼的分布式計(jì)算的計(jì)算模型，比較著名的就是MapReduce、MPI、BSP等。后來(lái)也產(chǎn)生了一些分布式計(jì)算系統(tǒng)，大家耳熟能詳?shù)腍adoop就是基于 MapReduce實(shí)現(xiàn)的。

本文的主人公是Parameter Server，其實(shí)也不算是新寵了，這個(gè)模型已經(jīng)被提出好幾年了，只不過(guò)在國(guó)內(nèi)還不是特別熱。不過(guò)最近一些云服務(wù)巨頭們開(kāi)始了對(duì)于PS的深入開(kāi)發(fā)和研究。

引用一位算法大神的話(huà)簡(jiǎn)單描述下什么事Parameter Server：總結(jié)是一種計(jì)算模型SSP+一種分布式設(shè)計(jì)看板模式Client+Server(partitioned table)+基于算法的調(diào)度策略(Scheduler)?？赡苡行┩瑢W(xué)還不太理解這句話(huà)，沒(méi)關(guān)系，下面通過(guò)一個(gè)實(shí)例來(lái)介紹一下PS。

二.場(chǎng)景

因?yàn)槲以趯W(xué)習(xí)PS的過(guò)程中是對(duì)照Map Reduce來(lái)學(xué)習(xí)的。所以也通過(guò)一個(gè)機(jī)器學(xué)習(xí)算法的并行計(jì)算的實(shí)例，來(lái)比較Map Reduce和PS。為了更好地突出PS的優(yōu)勢(shì)，這里用到的算法是一個(gè)梯度逼近***結(jié)果的一種算法-邏輯回歸(Logical Regression)。

為了更好地幫大家理解這些內(nèi)容，我也羅列了一些必須的知識(shí)儲(chǔ)備：

1.邏輯回歸算法-***fork里面的代碼看一下

2.隨機(jī)梯度下降SGD

3.李沐大神實(shí)現(xiàn)的一個(gè)PS開(kāi)源庫(kù)，上面有一個(gè)論文，一定要讀

4.并行邏輯回歸-等會(huì)會(huì)借用里面的內(nèi)容來(lái)講

5.ps開(kāi)源代碼網(wǎng)站

三.Work Flow

首先還是要補(bǔ)充幾句，Map-Reduce在實(shí)現(xiàn)并行算法的過(guò)程中有它的優(yōu)勢(shì)，但是也有很大的弊端，它在處理梯度問(wèn)題上沒(méi)有很好的效率。這一點(diǎn)PS通過(guò)client+server的模式很好的解決了這個(gè)問(wèn)題。

1.Map-Reduce處理LR

首先來(lái)看下Map-Reduce是如何解決邏輯回歸(下文統(tǒng)一稱(chēng)為L(zhǎng)R)的。首先是map的過(guò)程，將很大的數(shù)據(jù)切割成key-value的形式，我們?cè)谶@里假設(shè)所有的數(shù)據(jù)都是稠密的。比如說(shuō)你有100行數(shù)據(jù)，切割成5份，那么每一個(gè)worker就處理其中的20行數(shù)據(jù)。Reduce主要是負(fù)責(zé)統(tǒng)一 worker的計(jì)算結(jié)果。下面具體到LR的算法實(shí)現(xiàn)來(lái)講解下Map-Reduce的過(guò)程。

先來(lái)看看整體的流程圖：

***步：首先是進(jìn)行map階段對(duì)于長(zhǎng)尾數(shù)據(jù)的分割，我們假設(shè)數(shù)據(jù)是稠密非稀疏的。邏輯回歸的并行計(jì)算的數(shù)據(jù)分割，可以按行分、按列分或者行列一起分。分好的數(shù)據(jù)通過(guò)key-value的形式傳到每一個(gè)worker中，對(duì)應(yīng)上圖的map phase階段的worker。當(dāng)然，map里也包含LR的計(jì)算邏輯，邏輯請(qǐng)大家看上面的資料自己學(xué)習(xí)下。分割圖如下：

第二步：利用隨機(jī)梯度(SGD)方法逼近***解，在凸函數(shù)中LR是可以***接近***模型的，可以通過(guò)限定循環(huán)次數(shù)和收斂條件來(lái)實(shí)現(xiàn)。這其中就有一個(gè)問(wèn)題，認(rèn)真研究LR的同學(xué)可能會(huì)發(fā)現(xiàn)，如果我們使用SGD的話(huà)，因?yàn)閣orker之間雖然有一定的通信機(jī)制，但是并不是實(shí)時(shí)同步的，所以每一個(gè)worker并不知道對(duì)方的梯度是多少，形象的描述一下就是我們可以把SGD看成一個(gè)下坡問(wèn)題。

每個(gè)worker都在往終點(diǎn)方向下山(收斂模型)，但是它們彼此間并不能實(shí)時(shí)協(xié)作，也就是說(shuō)A不知道B爬到哪里，C不知道A爬到哪里。傳入一個(gè)路徑，我就接著向下爬一點(diǎn)，可能會(huì)走重復(fù)的路徑。所以說(shuō)Map-Reduce的SGD是一種范圍的梯度。每個(gè)worker不一定一直往下走，可能走走停停甚至往后走一點(diǎn)，但是因?yàn)閿?shù)據(jù)量巨大總是可以走到終點(diǎn)的。但是這樣就會(huì)浪費(fèi)了很多效率，這也就是Parameter Server重點(diǎn)解決的問(wèn)題。

第三步：負(fù)責(zé)reduce的服務(wù)器統(tǒng)一出一個(gè)模型輸出。

#p#

2.Parameter Server的一些機(jī)制

下面我們看下Parameter Server是怎么解決這個(gè)問(wèn)題。首先看下PS的總體架構(gòu)，PS是由client和server組成的，client對(duì)應(yīng)于上文的worker，負(fù)責(zé)計(jì)算。server是負(fù)責(zé)統(tǒng)一所有的client它們的參數(shù)，server間是聯(lián)通的。

如下圖：

總體來(lái)看，PS的優(yōu)勢(shì)是通過(guò)server來(lái)協(xié)同client的輸出，如上一節(jié)的下山問(wèn)題，PS可以協(xié)同每一個(gè)client按照一個(gè)方向直線(xiàn)下山，從而提高了效率。而這其中也有很多的技術(shù)細(xì)節(jié)需要考慮。

1).并行化設(shè)計(jì)

PS可以運(yùn)用很多并行化的思想從而提高效率。

(1)首先在client端，計(jì)算和上傳數(shù)據(jù)是采用的多線(xiàn)程機(jī)制，計(jì)算和數(shù)據(jù)傳輸在不同的線(xiàn)程中進(jìn)行從而增加了效率。同時(shí)server并不是等待所有參數(shù)都上傳完成，才向下分發(fā)的。如果一個(gè)client_a計(jì)算比較慢，server可以暫時(shí)不采用client_a的數(shù)據(jù)，而采用歷史數(shù)據(jù)。

(2)數(shù)據(jù)上傳也可以用樹(shù)狀結(jié)構(gòu)代替直接上傳，在client和server之間增加一層樹(shù)狀結(jié)構(gòu)可以提高數(shù)據(jù)傳輸效率，節(jié)約server的處理資源?？梢詮南聢D的左邊，變?yōu)橛疫叀?/p>

2).pull和push機(jī)制

首先，是在client端應(yīng)該上傳怎樣的數(shù)據(jù)，因?yàn)槊總€(gè)client節(jié)點(diǎn)都會(huì)不停的接受和反饋數(shù)據(jù)給server，那么到底應(yīng)該push怎樣的數(shù)據(jù)上去呢?這個(gè)一般來(lái)講是選擇步長(zhǎng)最長(zhǎng)的參數(shù)，也就是***的梯度值的參數(shù)push上去。

3).server端的異構(gòu)形式

因?yàn)槊總€(gè)client只處理一部分參數(shù)，server端需要將這些參數(shù)拼接起來(lái)，所以server端是一個(gè)異構(gòu)的組成形式。

3.Parameter Server處理LR

上面講了很多PS的機(jī)制，這里具體說(shuō)一下PS怎么實(shí)現(xiàn)LR。因?yàn)長(zhǎng)R的輸出是一個(gè)線(xiàn)性的回歸模型。輸出的結(jié)果是下面的這種式子：

z=w1*x1+w2*x2…..+w10*x2+….

我們要求的是里面的w1，w2，w3….這些參數(shù)，在PS中每個(gè)client計(jì)算的是其中的某些△w。通過(guò)server將這些△w同步上去，然后再push下去繼續(xù)迭代計(jì)算。這樣的好處是對(duì)于梯度問(wèn)題，每個(gè)client可以沿著一個(gè)方向走。

后話(huà)：我的理解還很淺，具體實(shí)現(xiàn)還有非常多的技術(shù)細(xì)節(jié)要敲定，部署在集群上也會(huì)出現(xiàn)各種問(wèn)題，如：log怎么輸出，有的client掛了怎么辦等等。建議有空可以看下李沐的開(kāi)源項(xiàng)目的代碼，還有上面提到的一些文檔。

博文出處：http://blog.csdn.net/buptgshengod/article/details/46819051

責(zé)任編輯：Ophira 來(lái)源：李博Garvin的專(zhuān)欄

分布式計(jì)算 PS 云計(jì)算

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板：噜噜噜噜狠狠狠7777视频 | 99精品国产一区二区青青牛奶 | 精品入口麻豆88视频 | 欧美中文字幕一区二区 | 午夜精品一区二区三区在线视频 | av入口| 亚洲免费观看视频网站 | 精品亚洲一区二区三区四区五区 | 99久久久久| 亚洲国产精品成人无久久精品 | 精品日韩一区二区 | 午夜免费视频观看 | 国产69精品久久99不卡免费版 | 看真人视频一级毛片 | 欧美一区二区视频 | 成人夜晚看av | 久久精彩视频 | 一级片av | 秋霞在线一区 | 国产精品久久久久久久久久久久久 | 久久99蜜桃综合影院免费观看 | 凹凸日日摸日日碰夜夜 | 99亚洲精品| 亚欧性视频| 久久免费福利 | a a毛片| 91在线视频免费观看 | 日韩av一区在线观看 | 成人在线不卡 | 欧美在线视频一区二区 | 国产精品96久久久久久 | 久久久精品一区 | 午夜无码国产理论在线 | 蜜桃视频在线观看www社区 | 久久免费视频1 | 日本高清视频在线播放 | 亚洲国产精品日本 | 日韩毛片播放 | 黄a在线观看 | 懂色中文一区二区在线播放 | www..99re|

<abbr id="4mkkw"></abbr>

<button id="4mkkw"><input id="4mkkw"></input></button>

<sup id="4mkkw"><tbody id="4mkkw"></tbody></sup>

<tfoot id="4mkkw"></tfoot>

<cite id="4mkkw"><samp id="4mkkw"></samp></cite><li id="4mkkw"><source id="4mkkw"></source></li>
<code id="4mkkw"><tr id="4mkkw"></tr></code>