成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<dfn id="m8aw4"><fieldset id="m8aw4"></fieldset></dfn><dl id="m8aw4"></dl>

<li id="m8aw4"><input id="m8aw4"></input></li>

<button id="m8aw4"></button>

<nav id="m8aw4"></nav>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

一日一技：如何從大量商品數(shù)據(jù)里面找到降價(jià)商品？

作者：kingname 2022-05-16 20:18:41

開(kāi)發(fā) 前端

每個(gè)商品每天都會(huì)爬一次，一共有61w+條數(shù)據(jù)。里面有N個(gè)商品降價(jià)了，現(xiàn)在需要把這些降價(jià)的商品找出來(lái)。

相信很多做爬蟲的同學(xué)都會(huì)爬電商網(wǎng)站，每天爬一次，然后監(jiān)控商品是否降價(jià)。如果你只監(jiān)控一個(gè)商品，那么是否降價(jià)這非常容易判斷，但如果你要找到這個(gè)網(wǎng)站里面所有降價(jià)的商品，那就非常麻煩了。

如下圖所示，是美國(guó)電商沃爾瑪?shù)娜旧唐窋?shù)據(jù)：

每個(gè)商品每天都會(huì)爬一次，一共有61w+條數(shù)據(jù)。里面有N個(gè)商品降價(jià)了，現(xiàn)在需要把這些降價(jià)的商品找出來(lái)。

商品有十幾萬(wàn)個(gè)，如果你分別找到每個(gè)商品的ID，然后用ID再找到這個(gè)商品每一天的數(shù)據(jù)，最后看它是否降價(jià)，這個(gè)工作量非常大，速度也會(huì)非常慢。

Pandas內(nèi)部使用了SIMB技術(shù)來(lái)對(duì)并行計(jì)算進(jìn)行優(yōu)化，我們需要盡量在不使用for循環(huán)的情況下，完成這個(gè)任務(wù)。

為了簡(jiǎn)單起見(jiàn)，我們假設(shè)降價(jià)就是指今天比昨天的價(jià)格低，不考慮先漲價(jià)再降價(jià)的情況。

要解決這個(gè)問(wèn)題，我們需要使用DataFrame的pct_change()方法。它就像是reduce一樣，給出一系列數(shù)據(jù)，它會(huì)計(jì)算數(shù)據(jù)改變量的百分比——第二條相對(duì)于第一條數(shù)據(jù)的改變，第三條數(shù)據(jù)相對(duì)于第二條數(shù)據(jù)的改變，第四條數(shù)據(jù)相對(duì)于第三條數(shù)據(jù)的改變。

首先我們使用date字段對(duì)數(shù)據(jù)進(jìn)行排序，確保價(jià)格是按時(shí)間排列的。然后對(duì)商品的id進(jìn)行分組，這樣就能拿到每一個(gè)商品每天的價(jià)格了。然后對(duì)price字段使用pct_change()：

df2['pct'] = df2.sort_values(['date', 'id']).groupby(['id']).price.pct_change()

運(yùn)行效果如下圖所示：

圖中最右側(cè)pct字段是NaN，是因?yàn)檫@是這些商品的第一條數(shù)據(jù)，所以始終是NaN.

我們篩選出今天(2022-05-16)，pct小于0的商品：

這些就是降價(jià)的商品了。我們可以隨便篩選一個(gè)商品來(lái)檢查一下：

使用pct_change()速度非?？欤?0w數(shù)據(jù)幾乎秒出。比f(wàn)or循環(huán)快多了。

責(zé)任編輯：武曉燕來(lái)源：未聞Code

商品數(shù)據(jù)監(jiān)控

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板：无码日韩精品一区二区免费 | 久久精品黄色 | 国产精品久久久久久久久久久免费看 | 99热激情 | 精品国产91乱码一区二区三区 | 亚洲欧美一区二区三区国产精品 | 欧美mv日韩mv国产网站91进入 | 欧美成ee人免费视频 | 国产成人在线一区二区 | 依人成人 | www成年人视频 | 97精品国产97久久久久久免费 | 亚洲精品电影网在线观看 | 高清久久 | 国产精品一区二区欧美黑人喷潮水 | 午夜丁香视频在线观看 | 亚洲国产精品人人爽夜夜爽 | 91久久夜色 | 国产精品久久久久久妇女6080 | 欧美精品二区三区 | 日韩精品在线观看免费 | 成人久草 | 欧美一级一 | 久久久精品欧美 | 国产一区久久 | 国产麻豆乱码精品一区二区三区 | 久久精品国产久精国产 | 91欧美激情一区二区三区成人 | 在线欧美一区 | 欧美日韩一区二区在线观看 | 黄色免费网址大全 | 精品日韩| 国产精品毛片一区二区三区 | 国产高清在线 | 一区二区成人在线 | 国产在线视频一区 | 亚洲国产精品久久久久秋霞不卡 | 日韩精品免费一区 | 精品国产乱码久久久久久影片 | 羞羞视频免费在线 | 日操操夜操操 |

<li id="cucae"><dl id="cucae"></dl></li>

<bdo id="cucae"><source id="cucae"></source></bdo>

<rt id="cucae"></rt>

<li id="cucae"><input id="cucae"></input></li>