時間:2022-05-05來源:小億瀏覽數(shù):810次
大數(shù)據(jù)分析系統(tǒng)架構圖
OLAP引擎:OLAP引擎提供全面的多維建模與分析能力。多維模型包括維度、層次、級別、屬性、指標、計算成員等;同時預置系列分析函數(shù),包括同比/環(huán)比/期比/基比等時間序列分析、占比/排名/方差等統(tǒng)計分析、指數(shù)回歸和線性回歸分析等;提供標準的MDX解析與執(zhí)行,與數(shù)據(jù)倉庫等模塊結合,提供針對海量數(shù)據(jù)的實時分析和處理能力。
語義層:為統(tǒng)一的查詢建模平臺和數(shù)據(jù)訪問接口。除提供標準的查詢建模能力外,還有語義驅(qū)動、語義規(guī)則、語義函數(shù)、描述器等等擴展方式,滿足不同層面的擴展要求。 數(shù)據(jù)集成:能夠勝任在大數(shù)據(jù)量、高并發(fā)、多維分析等環(huán)境背景下的實時分析。通過實時數(shù)據(jù)集成(RDI)提供的數(shù)據(jù)實時復制與DW的列式存儲引擎,解決了以往在傳統(tǒng)架構模式下,普通行式存儲引擎無法實現(xiàn)的業(yè)務場景。 數(shù)據(jù)倉庫:數(shù)據(jù)倉庫提供針對海量數(shù)據(jù)進行高效的查詢和分析。包括同時支持關系數(shù)據(jù)庫、NoSQL數(shù)據(jù)庫、以及分布式文件系統(tǒng)進行數(shù)據(jù)存儲和加載的多存儲引擎,基于MapReduce框架針對海量數(shù)據(jù)的高性能查詢和分析,以及MapReduce 框架本身具有的高擴展性和容錯性。 數(shù)據(jù)挖掘:支持運行于分布式文件系統(tǒng)和分布式計算平臺之上的分布式數(shù)據(jù)挖掘算法,具體包括:K均值、譜聚類算法及其分布式實現(xiàn);邏輯斯特回歸、樸素貝葉斯分類算法及其分布式實現(xiàn);頻繁模式挖掘分析算法及其分布式實現(xiàn);潛在狄利克雷分配語義挖掘算法及其分布式實現(xiàn);協(xié)同過濾、概率矩陣分解推薦算法及其分布式實現(xiàn);提供分布式挖掘算法的統(tǒng)一操作原語和執(zhí)行引擎。 流計算引擎:流計算引擎是為解決系統(tǒng)的實時性和一致性的高要求的實時數(shù)據(jù)處理框架,具備高可拓展性,能處理高頻數(shù)據(jù)和大規(guī)模數(shù)據(jù),實時流計算解決方案被應用于實時搜索、高頻交易的大數(shù)據(jù)系統(tǒng)上。 消息總線:包括主數(shù)據(jù)管理、應用集成開發(fā)環(huán)境、集中身份管理、集成監(jiān)控管理等。滿足集成平臺的應用需求,支持信息集成、界面集成、流程集成、服務集成等集成方式。 非結構化數(shù)據(jù)管理:非結構化數(shù)據(jù)不包含內(nèi)嵌的語義結構描述信息,而信息系統(tǒng)需要結合其“內(nèi)容”而不僅僅是數(shù)據(jù)本身進行查詢、檢索、分析與挖掘,因此非結構化數(shù)據(jù)管理系統(tǒng)需要實現(xiàn)非結構化數(shù)據(jù)的數(shù)據(jù)提取,提取的非結構化數(shù)據(jù)是進行后續(xù)處理的基礎,具體包括結構化信息和底層/高層特征的提取兩個。非結構化數(shù)據(jù)提取組件依賴于分布式文件系統(tǒng)和非結構化數(shù)據(jù)存儲提供的原始數(shù)據(jù)作為數(shù)據(jù)源數(shù)據(jù),依賴于非結構化數(shù)據(jù)存儲來存儲提取的元數(shù)據(jù)或者特征數(shù)據(jù),依賴于并行計算框架來分布化執(zhí)行過程,加快執(zhí)行速度。 分布式計算系統(tǒng):包括分布式文件系統(tǒng)和分布式計算框架。分布式文件系統(tǒng)以高可靠的容錯機制為核心,系統(tǒng)架構包括多元數(shù)據(jù)服務器、多數(shù)據(jù)存儲服務器、多監(jiān)管者、多客戶端,支持大文件和大數(shù)據(jù)塊的分布式存儲與管理;分布式計算框架基于MapReduce與MPI計算模型,提供了一套并行計算框架;并利用物理機以及虛擬機的監(jiān)控信息,實現(xiàn)對計算資源的合理分配,支持對大量工作任務的靈活切分和分布式調(diào)度。發(fā)布時間:2023-09-26瀏覽量:79次
發(fā)布時間:2022-06-28瀏覽量:970次
發(fā)布時間:2022-06-15瀏覽量:263次
發(fā)布時間:2022-06-14瀏覽量:544次
發(fā)布時間:2022-06-14瀏覽量:755次
400咨詢:4000011866
手機咨詢:137-0121-6791
技術支持QQ:400-0011-866
(工作日9:00-18:00)
產(chǎn)品建議郵箱
yixin@esensoft.com