奧推網

選單
遊戲

2018年一定要收藏的20款免費預測分析軟體!

【IT168 技術】本文推薦一些免費的預測分析軟體,它們主要用於分析統計使用,機器學習和資料探勘來尋找關於客戶行為,市場趨勢和原始資料集中其他領域的線索的相關性和模式。其中一些預測建模解決方案可透過許可,免費獲得開源或社群版本;其中一些預測分析軟體是商業版本的免費版或社群版,但提供的功能較少。

  什麼是預測分析軟體?

預測分析是高階分析的一個分支,用於對未來未知事件進行預測。預測分析使用資料探勘,統計,建模,機器學習和人工智慧等多種技術來分析當前資料,以預測未來!那麼下面將為大家簡單介紹一下以下的20多款工具!

  1.R Software Environment

R是用於統計計算和圖形的免費軟體,可執行在各種UNIX,Windows和Mac OS平臺上。R提供了廣泛的統計功能,如線性,非線性建模,經典統計測試,時間序列分析,分類,聚類和圖形技術。它也是高度可擴充套件的,提供資料操作,計算和圖形顯示,資料處理,陣列計算,資料分析工具,包括條件,迴圈和許多其他功能的程式語言。語言主要用於統計方法論的研究,R為它們提供了一個開源的途徑,可以在R中產生精心設計的質量圖,包括數學符號和公式。

  2.Dataiku

Dataiku Data Studio(DSS)是一個軟體平臺,彙總了從原始資料到生產應用程式所需的所有步驟和大資料工具。DSS分析資料透過簡單的介面操作,即可找到資料中的相關性和重要變數,並測試最佳擬合模型。DSS還可以將模型和預測值釋出到各種其他目的地,例如ElasticSearch,FTP伺服器和內部資料倉庫。

  3.Orange Data mining

Orange Data mining是一個開源的資料視覺化和分析工具。資料探勘是透過視覺化程式設計或透過Python指令碼完成的。Orange會記住這些選擇,提供最常用的組合,並智慧地選擇要使用的小部件之間的通訊通道。可以利用情節,條形圖,樹狀圖,網路和熱圖來進行視覺化。有機器學習的元件,可用於生物資訊學和文字挖掘。該解決方案包含了用於資料分析的功能,並且在Orange中有超過100個小部件。

  4.RapidMiner

RapidMiner可作為資料分析的獨立應用程式使用,也可作為整合到專有產品中的資料探勘引擎。RapidMiner提供資料探勘和機器學習程式,包括資料載入和轉換,資料預處理,視覺化,建模,評估和部署。RapidMiner是用Java程式語言編寫的。它採用的學習計劃和歸屬來自於Weka的機器學習環境,統計建模方案來自R Project。可用於文字挖掘,多媒體挖掘,功能設計,資料流挖掘的整合方法的發展,以及分散式資料探勘。

RapidMiner v6。0仍然是開源的。RapidMiner的最新版本現在僅作為試用版或商業許可證提供。

  5.Anaconda

Anaconda是一個由Python支援的開放式資料科學平臺。 Anaconda的開源版本是Python和R的高效能版本,包括超過100種用於資料科學的最受歡迎的Python,R和Scala軟體包。還可以訪問超過720個軟體包,可以使用包含在Anaconda中的conda,包,從屬關係等。

  6.KNIME

KNIME桌面版是開源的,是使用者友好的資料訪問,資料轉換,初步調查,預測分析,視覺化和報告的圖形工作臺。開放的整合平臺提供了1000多個模組或節點。KNIME還提供了基於資料資訊開發報告的能力,並將新見解的應用自動化回到生產系統。KNIME產品有KNIME Desktop,KNIME Professional,KNIME Team Space,KNIME Server和KNIME Cluster Execution。 KNIME Desktop可以自由下載到桌面。基於Eclipse平臺的,並且有雙重許可證。非開源產品中的功能包括共享儲存庫,身份驗證,遠端執行,排程,SOA整合和Web使用者介面。

  7.DMWay

DMWay使得預測分析更易於獲取並且價格合理。DMWay解決方案允許使用者在幾個小時或幾天而不是幾個月的時間內建立更好的預測模型,這可以適應任何行業。DMWay分析引擎可以提供最高級別的建模。分析引擎設計用於模擬經驗豐富的資料科學家採取的步驟,以建立準確有效的分析模型。DMWay評分引擎是建議企業尋求協助部署由分析引擎提供的預測分析結果的工具。

這個創新的解決方案是透過使用專家系統方法而不是“機器人”方法來實現的,模仿有經驗的資料科學家關於構建大規模預測模型的方式。DMWay評分引擎是為企業尋求協助部署由分析引擎提供的預測分析結果而推薦的工具。

  8.HP Haven Predictive Analytics

HP Distributed R是R語言的開源,可擴充套件和高效能平臺,可加速大規模機器學習,統計分析和圖形處理。Haven Predictive Analytics為HP Vertica提供資料加速和原生SQL支援。與市場領先的列式MPP資料庫的本地整合將總體資料訪問效能提高了5倍,並提供了一整套經過驗證的開箱即用的並行演算法,以成熟的標準R演算法生成準確一致的結果。是預測分析免費,完全相容開源R語言和工具,並得到惠普企業的支援,並按每個節點定價。HP Haven Predictive Analytics由HP Vertica和Distributed R提供支援。Distributed R是基於與HP Labs開發的開放原始碼R語言的高效能分析引擎,可滿足要求最苛刻的大資料預測分析任務。分散式R提高了效能,並允許使用者分析比以前流行的R統計程式語言更大的資料集。

  9.GraphLab Create

GraphLab Create是一個為開發人員和資料科學家構建的機器學習平臺,具有函數語言程式設計技巧和對資料科學的一些基本理解。能夠輕鬆地實現從想法到生產的原型和規模。示例服務包括推薦系統,欺詐檢測或客戶流失預測器。開發人員和資料科學家能夠快速部署並輕鬆與其他應用程式整合。Discover版本提供免費的開發者許可證,並提供社群論壇支援。

  10.Lavastorm分析引擎

Lavastorm分析引擎公開版是一個易於使用,成本效益的工具,用於臨時發現和業務分析。公開版對於希望將分析處理能力放在桌面上的使用者非常理想,而且不需要大型資料處理能力,提供自動持續分析和協作功能。Lavastorm是一種視覺化的資料發現解決方案,可以讓你快速整合不同的資料,輕鬆發現洞察,並持續檢測異常,異常值或模式。它為企業使用者提供自助服務能力,為IT使用者提供整合,分析和業務控制領域的快速開發能力。其功能包括從任何來源(包括大資料來源)獲取,轉換,合併和豐富資料,而不需要大量建模,預先規劃或用指令碼。可檢測資料問題,如完整性,格式不一致,準確性,自動化評估和清理流程。

  11.Actian Vector Express

Actian Analytics Platform(Express Hadoop SQL Edition)是Hadoop內部執行100%的免費社群版的端到端分析平臺。Actian分析平臺將Hadoop轉變為一個高效能的分析平臺,使企業能夠透過分析來自多個來源的資料而無需取樣,從而提高預測和決策的準確性。Actian Express,Hadoop SQL Edition使用現有的Hadoop叢集提供高速和價效比。Actian Vector Express是Actian分析平臺的免費社群版本,旨在提供快速簡單的方法來提高分析的效能。它建立在基於向量的分析資料庫基礎之上,Actian Express提供很好的效能和價效比,並且需要更少的硬體,幾乎不需要調整。Actian Vector Express包括以下功能:分析工作臺 - 快速構建可視工作流程準備,轉換和分析資料,分析資料庫 - 在幾秒鐘內運行復雜的查詢反對數十億條記錄和管理控制檯。

  12.Scikit-learn

scikit-learn是簡單高效的資料探勘和資料分析工具。它是Python中的機器學習庫,建立在NumPy,SciPy和matplotlib之上,它也是開源的。其特點包括分類,迴歸,聚類,降維,模型選擇和預處理。

  13.微軟R

R是強大的,用於統計計算,機器學習和圖形的首選程式語言,並得到使用者,開發者的繁榮的社群支援。R家族包括,伺服器,客戶端,SQL Server等服務。支援各種大資料統計,預測建模和機器學習功能,R Server支援基於開源R的全方位的分析探索,分析,視覺化和建模。Microsoft R客戶端是免費的社群支援。

  14.H2O.ai

H2O是一個開源的預測分析平臺。H2O使用者可以輕鬆地從微軟Excel和RStudio中探索和建模大資料,並將其與來自HDFS,S3,SQL和NoSQL資料來源的資料連線起來。H2O講述了資料科學的語言,支援R,Python,Scala,Java和強大的REST API。業務應用程式由H2O的NanoFastTM評分引擎提供支援。包括:分散式演算法和迴歸樹,如GBM,隨機森林(RF),廣義線性模型(GLM),k-均值和主成分分析(PCA)。

  15.Weka Data Mining

Weka是用於資料探勘任務的機器學習演算法的集合。演算法可以直接應用於資料集,也可以從Java程式碼呼叫。Weka包含用於資料處理,分類,迴歸,聚類,關聯規則和視覺化的工具。它也非常適合開發新的機器學習方案。 Weka是用Java編寫的,由紐西蘭懷卡託大學開發。

  16.Apache Spark

Apache Spark是用於大規模資料處理的快速且通用的引擎。Spark需要一個叢集管理器和一個分散式儲存系統。對於叢集管理,Spark支援獨立(本地Spark叢集),Hadoop YARN或Apache Mesos。對於分散式儲存,Spark能與各種各樣的,包括Hadoop分散式檔案系統(HDFS),MAPRA檔案系統(FS-MAPRA),Cassandra,OpenStack Swift,亞馬遜S3,Kudu,或自定義解決方案實現對接。

  17.Octave

Octave是數字計算的高階解釋語言。它提供了資料視覺化和操縱的線性,非線性問題和圖形的解決方案。有許多可用於公共數值線性代數解決問題的工具,尋找非線性方程的根,整合普通功能,操縱多項式,及整合的普通微分和代數微分方程。

  18.Tanagra

Tanagra是一個用於學術和研究目的的免費資料探勘軟體,它具有探索性資料分析,統計學習,機器學習和資料庫等多種資料探勘方法的功能。支援標準的資料探勘任務,如:視覺化,描述性統計,例項選擇,特徵選擇,功能建設,迴歸,影響因子分析,聚類,分類和關聯規則的學習。

  19.PredictionIO

PredictionIO是一款開源的機器學習伺服器,可以讓軟體開發人員建立個性化,推薦和內容發現等預測功能。透過PredictionIO,預測這種特點的使用者行為,提供個性化的影片,新聞,交易,廣告,職位,事件,檔案,應用程式,餐館和匹配服務。

  20.Apache Mahout

Apache Mahout提供可擴充套件的機器學習演算法,主要集中在協作過濾,聚類和分類。許多實現使用Apache Hadoop平臺,包括成熟的Hadoop MapReduce演算法,Scala,Spark和H2O演算法。協同過濾:基於使用者的協同過濾,基於專案的協同過濾,矩陣分解與ALS,矩陣分解與隱式反饋和加權矩陣分解,SVD + ALS。