熬了一夜!雙十一來了,為了幫女友買手機!我分析了上千部手機!
都說碼農(nóng)不容易,白天寫程序員,晚上熬夜加班,有的時候項目忙的連陪女友的時間都沒有!我容易嗎~~。這不雙十一來了,畢竟全年最優(yōu)惠的時刻,大家都不想錯過。小編也想幫女友更換一部手機,因此就想著快速的從眾多的手機中挑選出合適的手機。為了女友拼了!于是熬了一夜,看我如何從上千部手機中獲取到信息并進行簡單的信息評分,得到自己最滿意的幾部手機。
首先我們抓取到的是蘇寧平臺的手機信息,一共有2700+條手機信息。包括了手機的價格,名字,好評率、總評價數(shù)目和曬圖評價數(shù)目和網(wǎng)頁地址等信息。
通過數(shù)據(jù)清洗,將類別型中含有數(shù)值變量缺失值的行刪除,并將其轉(zhuǎn)化為數(shù)值型變量。對于非數(shù)值型變量信息,我們不做處理。
01.價格分布信息
對于手機來說,價格是一個重要的信息標簽,小編按照0到1000、1000-2000、2000-3000、3000-5000和5000+分為了5類。
- 可以看出,在所有的銷售手機當(dāng)中,價格在0-2000的手機類別是最多的,超過了全部手機的一半;
- 這類別中,價格在1000-2000的手機銷售類別數(shù)量是最多的。價格在5000+的銷售類別數(shù)是最少的;
- 對于大多數(shù)廠家,低端機制作技術(shù)更容易掌握,低端機更具有性價比;
- 而高端手機需要配合精湛的技術(shù)和工藝,而且主打旗艦品牌,因此,銷售的手機類別自然少一些。
02.不同價格下,手機的銷售量
接下來我們來看一下,不同價格區(qū)間下的手機的銷售量。這里的話,由于商品信息中,沒有給出明確的銷售數(shù)量。所以小編用總的評價數(shù)量來代替銷售量。
可以看到雖然2000價位的手機類別數(shù)量占據(jù)了第一位,但是在購買銷售數(shù)量上,3000-5000和5000+的手機占據(jù)了上風(fēng)。日益增長的物質(zhì)水平,讓大家越來越有錢買價格更高的手機。
03.不同品牌手機類別
那對于不同的手機類別,他們的手機類別如何呢?
在手機銷售類別中,華為手機銷售類別是最多的,緊隨其后的是小米和蘋果。而上述的五家公司的手機銷售類別,已經(jīng)占到了整個市場的73.22%,這也比較符合當(dāng)下我國的手機市場現(xiàn)狀。
04.簡單的手機挑選
經(jīng)過了簡單的數(shù)據(jù)分析后,接下來就是手機的挑選了。女友的要求很簡單,價格在2000-3000之間的,品牌不做要求。在這個狀況下,可以根據(jù)手機價格在2000-3000之間的進行篩選,然后根據(jù)手機的好評率、總評價數(shù)、帶圖評價率、手機價格和帶圖評價率/總評價數(shù)這五個特征來進行帶權(quán)重的評分,并按照評分進行手機的挑選。
上圖中,每個特征都有一個權(quán)重,權(quán)重是根據(jù)自己的喜好來進行設(shè)定。將最終的結(jié)果進行相加得到我們的最終值。首先,對于每個特征,我們需要進行歸一化處理,防止不同特征的數(shù)量級不同而帶來的偏差,然后我們設(shè)置每個特征的權(quán)重,然后將結(jié)果相加,得到最終的結(jié)果。
一頓操作猛如虎,對于五個特征進行歸一化處理,然后根據(jù)權(quán)重來計算總的得分,得分結(jié)果如程序上方圖所示。最后從幾千個手機里面挑選出華為的Nova5,小米的紅米K30。
以上就是小編熬了一夜,分析出來的結(jié)果,今天準備下單了。