成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

幾行 Python 代碼就可以提取數百個時間序列特征

開發 前端
時間序列數據是隨著時間的推移反復捕獲的變量值,隨著時間的推移可以產生一系列的按時間順序索引的數據點。在時間序列中,數據具有自然的時間順序,即一個變量在特定時間的值依賴于過去的值。

傳統的機器學習算法不能捕捉時間序列數據的時間順序。數據科學家需要執行相關的特征工程,將數據的重要特征捕獲到幾個指標中。生成大量的時間序列特征并從中提取相關特征是一項耗時且繁瑣的工作。

python的tsfresh包可以為時間序列數據生成標準的數百個通用特性。在本文中,我們將深入討論tsfresh包的使用。

tsfresh 是一個可以生成數百個相關的時間序列特征的開源包。 從 tsfresh 生成的特征可用于解決分類、預測和異常值檢測用例。

tsfresh 包提供了對時間序列數據執行特征工程的各種功能,包括:

  • 特征生成
  • 特征選擇
  • 與大數據的兼容性

安裝tsfresh 也非常的簡單,官方提供了pip和conda的安裝方式:

pip install -U tsfresh# orconda install -c conda-forge tsfresh

1、特征生成

tsfresh 包提供了一個自動特征生成 API,可以從 1 個時間序列變量中生成 750 多個相關特征。 生成的特征廣泛,包括:

  • 描述性統計(平均值、最大值、相關性等)
  • 基于物理的非線性和復雜性指標
  • 數字信號處理相關功能
  • 歷史壓縮特征

使用 tsfresh.extract_features() 函數可以為 1 個時間序列變量從多個域生成 789 個特征。

import pandas as pdfrom tsfresh import select_features# Read the time-series datadf = pd.read_excel("train.xlsx", parse_dates=['date']).set_index('date')# automated feature generationfeatures = tsfresh.extract_features(df, column_id="date", column_sort="date")

因為特征太多,所以具體的所有特征的介紹請查看官方文檔。

2、特征選擇

tsfresh 包還提供了一個基于假設檢驗的特征選擇實現,可以用于識別目標變量的相關特征。 為了限制不相關特征的數量,tsfresh 包含了fresh算法(fresh 代表基于可擴展假設測試的特征提?。?。

tsfresh.select_features() 函數用戶可以實現特征選擇。

3、兼容大數據

當我們有大量的時間序列數據時。tsfresh還提供api來擴展特征的生成/提取,以及針對大量數據的特征選擇實現:

  • 多線程處理:默認tsfresh包可以將特征生成/提取和特征選擇在多核上并行執行。
  • 分布式框架:tsfresh還實現了一個自己的分布式框架,將特征計算分布在多臺機器上加快計算速度。
  • Spark兼容:tsfresh還可以使用spark或Dask來處理非常大的數據。

最后總結,tsfresh可以通過幾行Python代碼中為時間序列特性生成和選擇相關特性。它會自動從基于時間的數據樣本的多個域中提取和選擇 750 +個經過實際測試的特征。 它減少了數據科學家浪費在特征工程上的大量工作時間。

并且時間序列數據是相當大的,tsfresh 也通過多線程、支持dask和spark來處理單機處理不了的大數據樣本。

責任編輯:華軒 來源: 今日頭條
相關推薦

2021-02-23 07:01:24

js小游戲技術

2012-02-01 10:13:04

2020-09-26 21:41:30

進度條Python代碼

2022-02-22 10:30:49

Kubernetes集群

2022-06-02 14:00:41

網絡攻擊黑客勒索攻擊

2023-03-30 15:12:47

2024-08-26 12:57:15

2022-03-01 15:26:29

漏洞網絡攻擊

2022-07-31 23:43:10

網絡安全漏洞風險管理

2021-11-09 06:34:32

CISA漏洞補丁

2022-07-04 11:17:54

微軟蠕蟲病毒Raspberry

2022-03-17 14:36:20

后門網絡安全

2016-09-13 23:05:47

2020-05-11 17:12:52

換臉Python圖像

2020-07-06 10:55:38

CIO首席信息官IT

2022-10-17 07:16:08

SQL機器學習AI

2024-01-07 16:56:59

Python人工智能神經網絡

2021-12-24 15:59:18

Azure漏洞源碼庫

2022-11-17 18:47:06

2013-04-15 09:51:53

中國聯通IDCSDN
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久综合影院 | 九九九久久国产免费 | 一区二区三区四区不卡视频 | 日本久久久久久久久 | 国产高清性xxxxxxxx | 婷婷激情综合 | 亚洲精品一区在线观看 | 神马久久春色视频 | 一区二区三区中文字幕 | 亚洲综合视频 | 日韩精品一区二区三区在线 | 欧美色影院 | 日日操视频| 91国产精品在线 | 国产成人叼嘿视频在线观看 | 国产一区二区不卡 | 久久精品一区 | 亚洲一区二区三区在线免费观看 | 成人av免费在线观看 | 午夜免费观看 | 91看片网 | 综合精品久久久 | 一级黄色片免费在线观看 | 国产一区二区三区高清 | 精品久久影院 | 国产97人人超碰caoprom | 国产一区久久 | 久久免费视频观看 | 影音先锋中文字幕在线观看 | 欧美一级三级 | 亚洲成人在线网 | 亚洲美女在线视频 | 国产三级一区二区 | 亚洲国产成人av好男人在线观看 | 日本精品一区二区三区在线观看视频 | 欧美精品片| 午夜在线观看视频 | 国产一区二区三区在线 | 中文字幕一区二区三区精彩视频 | 亚洲91视频| 欧美高清视频 |