使用Access 2007開始數據挖掘(一)
什么是數據挖掘
專家會告訴你,數據挖掘是使用自動化技術在企業斥資獲得的數據庫中建立有用的趨勢/信息。一旦得到了,這個信息就會被用來改進商業操作或制定更好的商業決策。涉及的技術有很多,包括聯合分析、集群、分類、模糊邏輯、神經網絡和數據清理等。然后這些技術與可視化工具聯系在一起,這些可視化工具包括報表、圖表、OLAP和其它的工具。
有專家來進行數據挖掘是很好,但是其它人群(占99%),那些既不懂數據挖掘又沒有時間和資金來獲得專業數據挖掘工具用于他們的數據庫的人們該怎么辦呢?他們能夠做什么?
為什么不使用流行的Microsoft Access工具而不是新工具來探究我們的數據庫呢?首先,Access與Microsoft Office/Excel中的圖表工具緊密集成在一起(見圖1)。Access所使用的圖表工具和Excel所使用的工具很類似;主要的不同是Access使用查詢而Excel使用單元。其次,Access支持工業級SQL查詢,并且其通過Links可以被任何種類的數據庫——從文本文件、電子數據表、SharePoint Lists、SQL server、Oracle、MySQL等等——當作一個客戶端應用程序。在它之上,設計良好的表單和VBA可以幫助你建立一個界面,從而為你的用戶提供便利,使得他們能夠開始靠他們自己研究他們的數據。
在Access 2007中有一些創新,這些創新將幫助人們探究他們的數據。這包括在Access 2007和Excel 2007中的非常類似的數據過濾界面;在用戶界面上透視圖、透視表是非常有用的,而交互過濾器現在在Access報表中也可以使用了。
在查詢和表單中過濾數據
所以我們怎樣將Access當作一個數據挖掘工具呢?事實是隨著Access 95的問世,它為表和查詢提供了Filter By Selection和Filter by form,從而就有了一組基本的數據探究工具可用在查詢和表格里。
例如,Filter by Selection是一個演示你可以怎樣探究數據的主要示例。右鍵單擊年份(比如2008)并選擇Filter by Selection,你將只顯示這個月的銷售。Filter by Selection是最重要的數據挖掘技術中很基本的一個——一個向下鉆取。它是到這個框架之中,在Access 2007中對用戶界面進行過濾來匹配Excel數據過濾而做的改變使得Access成為了一個更加通用的工具。這在圖3中做了說明,顯示了新的過濾界面。
圖3 – 現在在Access 2007中的過濾和Excel非常類似
在查詢中添加總計
如果你想過濾數據,那么這有一個非常新的創新,它將回答你的大多數數據問題,它就是Totals。當你打開一個查詢,在Home Ribbon中你將找到一個Totals按鈕。點擊它就會有一個額外的記錄添加到你的查詢中,如圖4所示。現在你可以右鍵單擊這個新的記錄并添加Sums或Averages或Counts之類的東西。這個創新真的很有用,因為以前總是在過濾之后復制黏貼到Excel中去計算總和。
圖4 – 添加一個Totals記錄到一個Access查詢中會降低對額外報表或復制到Excel的需求
通過上文的介紹相信大家對于使用Access 2007開始數據挖掘已經有所了解,希望大家再接再厲,熟練掌握這項技術。
【編輯推薦】