流行的十四個機器學習編程語言框架和工具
譯文【51CTO.com快譯】如果你想知道哪些不斷壯大的編程語言庫和工具是實現機器學習模型的不錯選擇,那么隨時可以獲得幫助。
O'Reilly的一項新調查發現,主要從事技術、金融和醫療保健行業的1300多人透露了他們在公司使用的機器學習技術。
本文介紹了面向數據科學界寵兒Python的軟件框架和庫、大數據平臺以及處理機器學習管道每個階段的基于云的服務。
說到使用機器學習或報告所稱的AI,大多數公司仍處于評估階段,實施的最常用工具是用于“模型可視化”和“自動模型搜索和超參數調整”的工具。
不出所料,一種最常見的機器學習是監督學習,即使用大量的標記數據來訓練機器學習模型。比如說,負責找出視頻中人員的計算機視覺模型可以拿注釋的圖像加以訓練,以表明圖像中有沒有人。
圖片來源:O'Reilly
以下是公司企業聲稱用于機器學習的庫、框架、大數據平臺和云服務。
軟件庫和框架
1.TensorFlow
谷歌廣泛使用的機器學習框架,旨在處理訓練機器學習模型時所需要的數值計算,能夠在CPU、GPU和專用芯片(比如谷歌的張量處理單元即TPU)之間劃分計算任務。
2.scikit-learn
用于數據挖掘和數據分析的一種流行Python庫,使用了眾多機器學習算法。
3.Pytorch
一種開源深度學習框架,學起來比TensorFlow等與之競爭的框架更容易,旨在用于機器學習管道的每個階段。
4.Keras
這種深度學習框架用于處理神經網絡(支持深度學習的受大腦啟發的數學模型),旨在比與之競爭的框架更易于使用。
Keras用Python編寫,它能夠在TensorFlow、微軟認知工具包(CNTK)和Python庫Theano上運行。
云套件
5.微軟Azure ML Studio
這套服務旨在幫助公司在微軟的Azure云上以及靠近網絡邊緣的計算設備上構建、訓練和部署機器學習模型。工具有助于使識別和調整適當的機器學習模型這個過程實現自動化,并有助于擴展底層計算以滿足需求。
6.谷歌云機器學習引擎
與Azure ML Studio相似,谷歌云機器學習引擎也提供了用于訓練、評估、調整和部署機器學習模型的工具。
7.亞馬遜SageMaker
亞馬遜SageMaker同樣提供了用于構建、訓練和部署機器學習模型的服務,以便能夠以更低的成本更快地將模型部署到生產環境。
大數據平臺工具
8.H20
這是一種開源內存中平臺,可以跨分布式系統擴展機器學習工作負載。
該平臺旨在支持使用最廣泛的統計和機器學習算法,并提供一定程度的自動化,以幫助數據科學家識別和調整適當的機器學習模型。
9.Prodigy
Prodigy旨在簡化訓練和評估機器學習模型的過程,這種工具可幫助數據科學家適當地標注訓練數據集。
10.Spark NLP
Spark NLP提供了一個自然語言處理(NLP)庫,旨在處理運行內存中大數據平臺Apache Spark的分布式系統。
11.OpenAI Gym
這種工具包用于開發和比較強化學習算法,強化學習是一種機器學習,其中軟件代理通過因導致期望結果的動作而受到獎勵來學習如何執行任務。
12.Analytics Zoo
Analytics Zoo將一系列大數據和機器學習技術整合到它所說的統一分析和AI平臺中。
該平臺整合了Spark、TensorFlow、Keras和深度學習庫BigDL,可以跨分布式Hadoop和Spark集群擴展機器學習模型,用于訓練和推理。
13.AllenNLP
旨在簡化設計和評估解決自然語言處理問題的新深度學習模型這個過程。
該庫包括面向核心NLP問題和NLP應用的高質量模型的參考實現。
14.Rise Lab Ray
這種框架用于跨分布式系統運行機器學習模型,提供高性能和容錯性,同時仍具有可擴展性。
原文標題:Most popular programming language frameworks and tools for machine learning,作者:Nick Heath
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】