成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

數據挖掘邏輯體系結構的內容類型有哪些

數據庫 SQL Server
在 Microsoft SQL Server Analysis Services 中,可以定義挖掘結構中各列的數據類型,以便影響創建挖掘模型時算法對這些列中數據的處理方式。

在 Microsoft SQL Server Analysis Services 中,可以定義挖掘結構中各列的數據類型,以便影響創建挖掘模型時算法對這些列中數據的處理方式。不過,定義列數據類型只向算法提供有關列中數據的類型的信息,而不提供有關該數據的行為的信息。因此,Analysis Services 中的每個數據類型都支持一種或多種數據挖掘內容類型,可以使用這些內容類型來說明列包含的內容的行為。例如,如果列內容以特定的間隔(如一周中的某幾天)重復,則可以將該列的內容類型指定為循環。

有些算法要求提供特定的數據類型和內容類型才能正常工作。例如,Microsoft Naive Bayespdf 算法的輸入不能為連續列,并且不能預測連續值。某些內容類型(如 Key Sequence)只能由特定算法使用。有關算法以及每種算法所支持的內容類型的列表,請參閱數據挖掘算法(Analysis Services – 數據挖掘)。

下表介紹了數據挖掘中使用的內容類型,并標識了支持每種類型的數據類型。

Discrete

離散意味著列包含數值之間沒有連續體的有限數量的數值。例如,性別列是一個典型的離散屬性列,這是因為該數據表示特定數量的類別。

離散屬性列中的值不能意味著排序,即使這些值為數值也是如此。此外,即使用于離散列的值為數值,也無法計算小數值。電話區號即為數值離散數據的典型示例。

所有數據挖掘數據類型均支持 Discrete 內容類型。

Continuous

此列包含的值表示某一允許中間值的范圍中的數值數據。與表示有限、可數數據的離散列不同,連續列表示可縮放度量,且數據可能包含無限數目的小數值。溫度列即為連續屬性列的示例。

以下數據類型支持 Continuous 內容類型:Date、Double 和 Long。

Discretized

該列包含表示組或存儲桶的值,這些值屬于從連續列派生的值。存儲桶被視為有序的離散值。

離散化是將一組連續數據的值放入存儲桶的過程,以便得到有限數目的可能值。只能離散數值數據。

您可以手動離散數據,以確保獲取所需的存儲桶,還可以使用 SQL Server Analysis Services 中提供的離散方法。某些算法自動執行離散。有關詳細信息,請參閱如何更改挖掘模型中列的離散化。

以下數據類型支持 Discretized 內容類型:Date、Double、Long 和 Text。

Key

該列唯一地標識一行。在事例表中,鍵列通常為數值或文本標識符。將內容類型設置為 key 可指示該列不應用于分析,而僅應用于跟蹤記錄。

嵌套表也有鍵,但嵌套表鍵的用法稍有不同。如果某列是您需要分析的屬性,則在嵌套表中將內容類型設置為 key。嵌套表鍵的值對于每個事例來說都必須唯一,但在整個事例集中可以重復。

例如,如果分析的是客戶購買的產品,則可以對于事例表中 CustomerID 列將內容類型設置為鍵,然后對于嵌套表中 PurchasedProducts 列再次將內容類型設置為鍵。

注意:

只有在使用已被定義為 Analysis Services 數據源視圖的外部數據源中的數據時,嵌套表才可用。

以下數據類型支持此內容類型:Date、Double、Long 和 Text。

Key Sequence

將內容類型設置為 key sequence 時,它指示列包含表示一個事件序列的值。這些值是有序值,但不必按等差排列。

以下數據類型支持此內容類型:Double、Long、Text 和 Date。

Key Time

將內容類型設置為 key time 時,它指示兩件事情:第一,值按順序排列并表示時間刻度。第二,模型必須為時序模型或順序分析和聚類分析模型。只有在這些模型中,您才可以將列指定為鍵時間。

以下數據類型支持此內容類型:Double、Long 和 Date。

Table

嵌套表為列的一種特殊類型,它包含另外一個數據表,該數據表中有一列或多列和一行或多行。對于事例表中的任意特定行,此列可以包含多個值,所有的值均與父事例記錄相關。例如,如果主事例表包含一個客戶列表,則可能有多個包含嵌套表的列,例如,ProductsPurchased 列,嵌套表在該列中列出了此客戶過去購買的產品,Hobbies 列出了該客戶的興趣。

此列的數據類型始終為 Table。

Cyclical pdf

該列包含表示循環有序集的值。例如,一周內順序編號的七天便是循環有序集,因為第一天緊跟第七天。

循環列就內容類型而言既有序又離散。

Analysis Services 中所有的數據挖掘數據類型都支持此內容類型。但是,大多數算法將循環值視為離散值,不會進行特殊處理。

Orderedpdf

Ordered 內容類型定義了序列或順序;但是,用于排序的值并不表示該集中值之間的任何差或量級關系。例如,如果有序屬性列包含按照等級順序從一到五排列的有關技術等級的信息,則技術等級之間的差并不包含什么暗示信息;技術等級五不一定比技術等級一好五倍。

有序屬性列就內容類型而言是離散的。

Analysis Services 中所有的數據挖掘數據類型都支持此內容類型。但是,大多數算法會將已排序值視為離散值,不會進行特殊處理。

Classified

除了前面列出的可通用于所有模型的內容類型以外,對于某些數據類型,還可以使用已分類列定義內容類型。

原文鏈接:http://www.cnblogs.com/codeaspnet/archive/2011/07/22/2114400.html

【編輯推薦】

  1. 代號:Denali,SQL Server再出擊
  2. 說說SQL Server編年史
  3. 簡單說說SQL Server上的加密術
  4. 擦亮自己的眼睛去看SQL Server
責任編輯:艾婧 來源: icbj.cn
相關推薦

2010-02-23 16:07:39

2009-06-26 15:58:28

EJB

2020-02-18 16:07:17

物聯網表存儲數據庫

2011-05-20 09:22:43

Oracle數據庫體系結構

2010-04-08 10:02:15

Oracle體系結構

2009-09-11 10:38:03

LINQ體系結構

2012-02-06 17:22:44

MySQL

2014-07-23 09:33:52

2009-07-15 13:46:26

Swing體系結構

2009-03-30 10:53:37

體系結構數據倉庫Oracle

2013-08-01 11:17:20

SAP

2010-09-25 13:38:23

Inside JVM

2016-12-26 10:29:01

Spring框架結構

2010-08-16 12:54:21

ASON路由技術

2010-06-21 14:51:14

ASON路由

2009-07-10 16:07:10

TikeSwing創建MVC體系結構

2009-09-08 14:34:42

Linq to SQL

2010-04-23 09:13:05

Oracle體系結構

2009-01-18 16:50:31

數據倉庫數據倉庫概念模型數據挖掘

2010-09-27 09:43:07

JVM體系結構
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 在线一区二区观看 | 国产精品视频不卡 | 99小视频| 中文字幕亚洲精品 | 国产精品国产三级国产aⅴ浪潮 | 91精品久久久久久久久久入口 | 中文在线播放 | 91 在线 | 中文字幕一区二区三区四区五区 | 午夜精品久久久久99蜜 | 综合九九 | 99精品欧美一区二区三区综合在线 | 日韩中字幕 | 日韩一区二区三区在线看 | 国产日韩91 | 日日草夜夜草 | 国产乱码久久久久久 | 中文字幕国产精品 | 亚欧午夜 | 久久久久久www | 污污的网站在线观看 | 好好的日在线视频 | 久久久tv | 91大神新作在线观看 | 精品久久久网站 | 黄色免费av| 午夜视频免费在线观看 | 国产一级视频在线 | 日韩高清三区 | 欧美精品二区 | 亚洲小视频在线播放 | a在线观看 | 91社区在线观看播放 | 国产一区欧美 | 男女羞羞视频大全 | 亚洲成人一区 | 亚洲视频一区 | 欧美日韩在线播放 | 自拍视频在线观看 | 久久久久久国产精品免费免费 | 国产一区二区在线免费观看 |