Greenplum是全球優秀的大數據分(fen)析引擎,專為分(fen)析、機器學(xue)習和AI而打造。
Greenplum創建和部署(shu)復雜模型(xing),大量數百節點集群為全球優秀企業(ye)生產系統提供(gong)服(fu)務,被廣(guang)泛應用于網絡安全,預測(ce)性維護,風險(xian)管理(li),欺詐檢測(ce)等(deng)領域。
Greenplum大數據平臺基于MPP(大規模并行處理)架構,具有強(qiang)大的(de)內核技術,包括數(shu)據(ju)水平分布、并行(xing)(xing)查詢(xun)執行(xing)(xing)、優化(hua)器、線性擴展能(neng)力、多態(tai)存儲、資(zi)源管理、高(gao)可(ke)用、高(gao)速(su)數(shu)據(ju)加載(zai)等(deng)。
Greenplum支(zhi)持(chi)多(duo)種數(shu)(shu)(shu)據(ju)源(yuan)和數(shu)(shu)(shu)據(ju)格(ge)式,支(zhi)持(chi)各種數(shu)(shu)(shu)據(ju)源(yuan),包括Hadoop、HIVE、HBase、S3、Gemfire、各種數(shu)(shu)(shu)據(ju)庫和文(wen)(wen)件等,不(bu)需要(yao)移動數(shu)(shu)(shu)據(ju),避免了(le)數(shu)(shu)(shu)據(ju)加載(zai)的(de)復雜性,和其帶來的(de)數(shu)(shu)(shu)據(ju)不(bu)一致的(de)問題。不(bu)管是結構化、半(ban)結構化(XML、JSON、KV)還是非結構化,譬如(ru)文(wen)(wen)本(ben)數(shu)(shu)(shu)據(ju)、GIS數(shu)(shu)(shu)據(ju)、圖數(shu)(shu)(shu)據(ju)等。
Greenplum的(de)(de)(de)存(cun)(cun)儲(chu)支(zhi)持堆表,以及(ji)面向(xiang)行(xing)存(cun)(cun)或列存(cun)(cun)的(de)(de)(de)追(zhui)加表。用戶(hu)可(ke)以創建(jian)基(ji)于任意存(cun)(cun)儲(chu)類(lei)型的(de)(de)(de)分(fen)區(qu)表,同(tong)時可(ke)以靈活(huo)配置(zhi)表和分(fen)區(qu)的(de)(de)(de)壓(ya)縮(suo)(suo)類(lei)型、壓(ya)縮(suo)(suo)級(ji)別和存(cun)(cun)儲(chu)塊大小等參數(shu)。