成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

dataWrangler簡介及使用方法

大數(shù)據(jù)
dataWrangler是一款由斯坦福大學(xué)開發(fā)的在線數(shù)據(jù)清洗、數(shù)據(jù)重組軟件。主要用于去除無效數(shù)據(jù),將數(shù)據(jù)整理成用戶需要格式等。通過使用dataWrangler能節(jié)約用戶花在數(shù)據(jù)整理上的時(shí)間,從而使其有更多的精力用于數(shù)據(jù)分析。

[[200500]]

1. 工具簡介

dataWrangler是一款由斯坦福大學(xué)開發(fā)的在線數(shù)據(jù)清洗、數(shù)據(jù)重組軟件。主要用于去除無效數(shù)據(jù),將數(shù)據(jù)整理成用戶需要格式等。通過使用dataWrangler能節(jié)約用戶花在數(shù)據(jù)整理上的時(shí)間,從而使其有更多的精力用于數(shù)據(jù)分析。

2. 主要特點(diǎn)

dataWrangler的操作極為簡便,通過簡單點(diǎn)擊就能完成一系列的數(shù)據(jù)整理。與傳統(tǒng)的數(shù)據(jù)處理軟件相比,其獨(dú)特的智能分析和建議功能,極大方便了用戶的數(shù)據(jù)處理操作。dataWrangler還會列出數(shù)據(jù)修改的歷史記錄,用戶可以極為方便地查看過去的修改,并可以撤銷某一條修改操作。

同時(shí),dataWrangler是一款在線工具,這為用戶省去了安裝軟件的繁瑣過程,也使用戶擺脫了操作系統(tǒng)對軟件使用的限制。

3. 工具界面(工作區(qū)、菜單、術(shù)語等)

在瀏覽器的地址欄中輸入dataWrangler的地址并進(jìn)入后,會進(jìn)入dataWrangler獲取輸入數(shù)據(jù)的界面,如下圖所示。

 

進(jìn)入dataWrangler后的數(shù)據(jù)輸入界面。 

將CSV格式的數(shù)據(jù)拷貝并粘貼到數(shù)據(jù)輸入?yún)^(qū)域后點(diǎn)擊dataWrangle按鈕,進(jìn)入數(shù)據(jù)處理界面,開始數(shù)據(jù)的整理和修復(fù)。數(shù)據(jù)處理界面如下圖所示。 

 

數(shù)據(jù)處理主界面。

數(shù)據(jù)處理界面左側(cè)的面板包括一個(gè)根據(jù)當(dāng)前選中數(shù)據(jù)給出的數(shù)據(jù)修改建議列表和一個(gè)數(shù)據(jù)操作歷史記錄列表。點(diǎn)擊修改建議列表中的粗體部分,就可以執(zhí)行該條修改建議。界面的右側(cè)是包含具體數(shù)據(jù)的數(shù)據(jù)表。

4. 操作流程(核心功能呈現(xiàn))

下面介紹dataWrangler的主要功能。

->去除無效數(shù)據(jù)

點(diǎn)擊無效數(shù)據(jù)的行號,這一行就會變成紅色高亮狀態(tài),同時(shí)左側(cè)的建議欄會給出一系列的修改建議。點(diǎn)擊合適的修改建議后, 該修改操作將被執(zhí)行。 

 

刪除空行操作。 

如圖所示,點(diǎn)擊”Delete empty rows”的修改建議后,所有空白行將被刪除。

->提取部分?jǐn)?shù)據(jù)

在需要提取部分?jǐn)?shù)據(jù)作為單獨(dú)一列時(shí),首先選中欲提取的數(shù)據(jù),此時(shí)dataWrangler會自動分析用戶的意圖,并提取出相應(yīng)數(shù)據(jù)。如果用戶進(jìn)行二次選取,則會對選取意圖進(jìn)行修正,以提取用戶真正需要的數(shù)據(jù)。

下圖是用戶欲提取州名時(shí),首先選取了”Alabama”,但此時(shí)dataWrangler認(rèn)為用戶想要提取相應(yīng)長度的字符, 所以沒有達(dá)到要求的”Alaska”并未被選取, 同時(shí)”California”等較長的字符也只被截取了一部分。 

 

選擇欲提取的數(shù)據(jù)。 

此時(shí),繼續(xù)選取”Alaska”,dataWrangler通過二次選取獲知用戶想要提取的是這一位置的整個(gè)單詞,進(jìn)而成功提取出了州名。如下圖所示。 

 

通過二次選取修正提取結(jié)果。 

->自動填充數(shù)據(jù)

提取出州名后,需要將其填充到每一行數(shù)據(jù)中。此時(shí),只需點(diǎn)擊一下州名數(shù)據(jù)列最上方的標(biāo)題,左側(cè)的智能建議欄中就會出現(xiàn)自動填充數(shù)據(jù)的建議。點(diǎn)擊該建議,即可完成自動填充數(shù)據(jù),如下圖所示。

 

自動填充數(shù)據(jù)。

->刪除無用數(shù)據(jù)

進(jìn)行數(shù)據(jù)自動填充后,遺留下來的一些數(shù)據(jù)欄已經(jīng)沒有任何意義,需將其刪除。點(diǎn)擊欲刪除數(shù)據(jù)中國的某一行,dataWrangler會自動給出刪除建議。同時(shí),將被刪除的行將會高亮表示,如下圖所示。 

 

刪除無用行。

點(diǎn)擊左側(cè)刪除建議執(zhí)行刪除操作,結(jié)果如下圖所示。

 

刪除無用行后的結(jié)果。

->數(shù)據(jù)重構(gòu)

在某些情況下,可能需要將數(shù)據(jù)重新組合成需要的格式。點(diǎn)擊表格上方的綠色方塊后,dataWrangler會給出多種數(shù)據(jù)重構(gòu)建議。如下圖所示。 

 

對數(shù)據(jù)進(jìn)行重構(gòu)。

雙擊列名,可以對列名進(jìn)行編輯, 圖中的列名已經(jīng)修改為”year”,”state”等有意義的文字。

點(diǎn)擊左側(cè)重構(gòu)建議后,得到的數(shù)據(jù)結(jié)果如下圖所示。 

 

數(shù)據(jù)重構(gòu)后的結(jié)果。

此時(shí),每一行是一個(gè)州在不同年份的數(shù)據(jù)。 

責(zé)任編輯:龐桂玉 來源: 36大數(shù)據(jù)
相關(guān)推薦

2011-04-08 10:43:44

2009-08-04 08:32:06

Linux Find命Linux Find使用方法

2009-11-24 09:26:31

pbr策略路由

2010-11-19 09:56:38

SQLiteAndroid

2010-09-24 17:08:03

SQL Server唯

2023-07-03 15:55:05

語法jpa狀態(tài)

2010-08-06 13:37:28

Flex[Bindab

2023-11-10 08:17:01

分布式搜索引擎

2012-01-13 09:55:54

jQuery

2011-02-24 13:09:10

FireFTP

2009-08-24 16:56:26

ASP.NET Log

2023-05-11 08:00:44

Golangsync.Pool

2009-12-24 16:36:06

WPF InkCanv

2009-09-04 09:04:54

VMware虛擬機(jī)軟件

2023-06-28 08:34:02

Bind()函數(shù)JavaScript

2009-12-28 13:28:03

WPF視頻

2010-05-28 19:12:09

MySQL使用方法

2009-08-11 09:26:06

2011-09-06 09:26:03

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 久久久久免费精品国产小说色大师 | 9久久| 伊人激情综合网 | 激情亚洲 | 久久久区| 成人片免费看 | 免费精品视频 | 亚洲国产成人精品久久久国产成人一区 | 91国产在线播放 | 国产一级网站 | 日韩电影免费在线观看中文字幕 | 日韩免费网站 | 久久久久国产一区二区三区四区 | 日韩精品一区二区三区在线播放 | 三级在线观看 | 365夜爽爽欧美性午夜免费视频 | 台湾佬成人网 | 成人精品一区二区三区中文字幕 | 成人影院网站ww555久久精品 | 欧美精品一区二区三区四区五区 | 欧美精品一区二区在线观看 | www.久久影视 | 国产精品www| 四虎在线视频 | 国产高清免费视频 | 热久久免费视频 | 在线天堂免费中文字幕视频 | 欧美激情va永久在线播放 | 91精品国产乱码久久蜜臀 | 91中文字幕在线观看 | 日本大香伊一区二区三区 | 国产乱码久久久久久一区二区 | 精久久久 | 亚洲综合无码一区二区 | 中文字幕一区在线观看视频 | 日韩中文字幕一区二区三区 | 在线观看h视频 | 久久国产视频播放 | 国产日韩精品在线 | 免费一区二区 | 欧洲高清转码区一二区 |