面向Linux的十大開源人工智能工具
譯文【51CTO.com快譯】目前,人工智能是科技界不斷發(fā)展的領(lǐng)域之一,主要側(cè)重于構(gòu)建軟硬件,以便在醫(yī)療、教育、安全、制造、銀行及其他眾多領(lǐng)域解決日常生活中的挑戰(zhàn)。我們在本文中將介紹幾款面向Linux生態(tài)系統(tǒng)的***開源人工智能工具。
下面列出了為支持人工智能設(shè)計和開發(fā)的諸多平臺,你可以在Linux及其他許多操作系統(tǒng)上使用。切記:介紹順序不分先后。
1. Deep Learning For Java(Deeplearning4j)
Deeplearning4j是一種商用級、開源、即插即用的分布式深度學(xué)習(xí)庫,面向Java和Scala編程語言。它是專門為商業(yè)相關(guān)應(yīng)用設(shè)計的,并與分布式CPU和GPU上的Hadoop和Spark整合起來。
DL4J采用Apache 2.0許可證發(fā)布,它提供了GPU支持,以便在AWS上進(jìn)行擴(kuò)展,并且適用于微服務(wù)架構(gòu)。
Deeplearning4j - Deep Learning for Java
主頁鏈接:http://deeplearning4j.org/
2. Caffe――深度學(xué)習(xí)框架
Caffe是一種模塊化、表達(dá)式的深度學(xué)習(xí)框架,以速度見長。它采用BSD 2-Clause許可證發(fā)布,已經(jīng)支持研究、初創(chuàng)公司原型以及視覺、速度和多媒體之類的工業(yè)應(yīng)用等領(lǐng)域的幾個社區(qū)項目。
Caffe――深度學(xué)習(xí)框架
主頁鏈接:http://caffe.berkeleyvision.org/
3. H20――分布式機(jī)器學(xué)習(xí)框架
H20是一種開源、快速、可擴(kuò)展的分布式機(jī)器學(xué)習(xí)框架,另外該框架還有各種各樣的算法。它支持更智能化的應(yīng)用,比如深度學(xué)習(xí)、梯度提升、隨機(jī)森林、廣義線性建模(比如邏輯回歸和彈性網(wǎng)絡(luò))以及其他更多。
這是一種面向企業(yè)的人工智能工具,用于利用數(shù)據(jù)做決策,它讓用戶能夠使用更快速、更準(zhǔn)確的預(yù)測建模,從數(shù)據(jù)獲取洞察力。
H2O――分布式機(jī)器學(xué)習(xí)框架
主頁鏈接:http://www.h2o.ai/
4. MLlib――機(jī)器學(xué)習(xí)庫
MLli是一種開源、易于使用、高性能的機(jī)器學(xué)習(xí)庫,是作為Apache Spark的一部分開發(fā)的。它實際上易于部署,可以在現(xiàn)有的Hadoop集群和數(shù)據(jù)上運行。
MLlib還隨帶一系列算法,可用于分類、回歸、推薦、聚類、生存分析及更多方面。重要的是,它可以用在Python、Java、Scala和R等編程語言中。
MLlib――機(jī)器學(xué)習(xí)庫
主頁鏈接:https://spark.apache.org/mllib/
5. Apache Mahout
Mahout是一種開源框架設(shè)計工具,用于構(gòu)建可擴(kuò)展的機(jī)器學(xué)習(xí)應(yīng)用程序,它擁有如下三大功能:
- 提供簡單、可擴(kuò)展的編程工作環(huán)境。
- 提供諸多預(yù)包裝算法,支持Scala + Apache Spark、H20以及Apache Flink。
- 包括Samaras,這是一種向量數(shù)學(xué)試驗型工作環(huán)境,擁有類似R的語法。
Apache Mahout
主頁鏈接:http://mahout.apache.org/
6. 開放神經(jīng)網(wǎng)絡(luò)庫(OpenNN)
OpenNN也是一種用C++編寫的開源類庫,面向深度學(xué)習(xí),它用于構(gòu)建神經(jīng)網(wǎng)絡(luò)。然而,它最適合經(jīng)驗豐富的C++程序員以及機(jī)器學(xué)習(xí)技能出色的人員。它的特點就是擁有深度架構(gòu)和高性能。
OpenNN――開放神經(jīng)網(wǎng)絡(luò)庫
7. Oryx 2
Oryx 2是最初的Oryx項目的延續(xù),它是在Apache Spark和Apache Kafka上開發(fā)的,重新設(shè)計了Lambda架構(gòu),不過專門面向?qū)崟r機(jī)器學(xué)習(xí)。
這是個應(yīng)用開發(fā)平臺,還隨帶協(xié)作過濾、分類、回歸和聚類等方面的某些應(yīng)用程序。
Oryx2――重新設(shè)計Lambda架構(gòu)
主頁鏈接:http://oryx.io/
8. OpenCyc
OpenCyc是一種開源門戶網(wǎng)站,通向世界上***、最全面的一般知識庫和常識推理引擎。它包括大量的Cyc術(shù)語,這些術(shù)語用一種精確設(shè)計的本體來排列,支持這些領(lǐng)域的應(yīng)用:
- 豐富領(lǐng)域建模
- 特定領(lǐng)域?qū)<蚁到y(tǒng)
- 文本理解
- 語言數(shù)據(jù)整合、人工智能游戲及其他
OpenCyc
主頁鏈接:http://www.cyc.com/platform/opencyc/
9. Apache SystemML
SystemML是一種面向機(jī)器學(xué)習(xí)的開源人工智能平臺,最適合大數(shù)據(jù)。主要功能特性:支持類似R和Python的語法,專注于大數(shù)據(jù),專門為高級數(shù)學(xué)設(shè)計。主頁上詳細(xì)解釋了其工作原理,包括視頻演示,作了明確的講解。
有幾個方法可以使用它,包括Apache Spark、Apache Hadoop、Jupyter和Apache Zeppelin。一些重要的使用場合包括汽車、機(jī)場交通和社群金融。
Apache SystemML――機(jī)器學(xué)習(xí)平臺
主頁鏈接:http://systemml.apache.org/
10. NuPIC
NuPIC是一種機(jī)器學(xué)習(xí)開源框架,基于分層時間記憶(HTM),這是一種大腦皮層理論。用NuPIC集成的HTM程序是為分析實時流數(shù)據(jù)而實踐的,它能學(xué)習(xí)數(shù)據(jù)中基于時間的模式,預(yù)測當(dāng)前值,并且發(fā)現(xiàn)任何不規(guī)則的地方。
它的重要功能特性包括如下:
- 持續(xù)在線學(xué)習(xí)
- 時間和空間模式
- 實時流數(shù)據(jù)
- 預(yù)測和建模
- 強(qiáng)大的異常檢測
- 分層時間記憶
NuPIC機(jī)器學(xué)習(xí)
主頁鏈接:http://numenta.org/
由于人工智能領(lǐng)域的研究方興未艾,我們勢必會看到更多的工具涌現(xiàn)出來,有助于讓這個技術(shù)領(lǐng)域大獲成功,尤其是用于克服日常的科學(xué)挑戰(zhàn),并且滿足教學(xué)用途。
原文標(biāo)題:10 Top Open Source Artificial Intelligence Tools for Linux,作者:Aaron Kili
【51CTO譯稿,合作站點轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】