華為企業(yè)級(jí)大數(shù)據(jù)分析平臺(tái)FusionInsight 包括FusionInsight Hadoop和FusionInsight Streaming兩個(gè)組件:
Fusion Insight Hadoop包含了開放社區(qū)的主要軟件及其生態(tài)圈中的主流組件,并進(jìn)行了大量?jī)?yōu)化,讓企業(yè)可以從各類繁雜無(wú)序的海量數(shù)據(jù)中洞察商機(jī);
FusionInsight Streaming是FusionInsight企業(yè)級(jí)大數(shù)據(jù)分析平臺(tái)中的實(shí)時(shí)數(shù)據(jù)處理引擎,以事件驅(qū)動(dòng)(Event-driven)模式處理實(shí)時(shí)數(shù)據(jù)的大數(shù)據(jù)技術(shù),解決高速事件流的實(shí)時(shí)計(jì)算問題。可以在金融、通信、交通、公共安全等領(lǐng)域發(fā)揮流式事件實(shí)時(shí)處理優(yōu)勢(shì),提供實(shí)時(shí)分析、實(shí)時(shí)決策能力。
智慧:高達(dá)百萬(wàn)維度的全量建模,深刻洞察用戶行為與特征。
實(shí)時(shí):對(duì)海量數(shù)據(jù)進(jìn)行在線實(shí)時(shí)處理。
可信:第一家支持RBAC用戶組權(quán)限管理、消除HDFS明文存放;第一家支持超過1000公里以上的異地容災(zāi)。
易用:原生態(tài)的大數(shù)據(jù)技術(shù)因其本身的復(fù)雜性,局限應(yīng)用于自身具備強(qiáng)大研發(fā)實(shí)力的互聯(lián)網(wǎng)行業(yè),而華為FusionInsight產(chǎn)品針對(duì)傳統(tǒng)行業(yè)客戶設(shè)計(jì),全自動(dòng)化在線運(yùn)行維護(hù),自定義Dashboard,自動(dòng)化的二次開發(fā)助手,大幅降低了大數(shù)據(jù)在傳統(tǒng)企業(yè)內(nèi)部的部署難度,幫助傳統(tǒng)企業(yè)輕松駕馭大數(shù)據(jù)業(yè)務(wù)。
分類 | 指標(biāo)項(xiàng) | 規(guī)格 | 說明 |
并行計(jì)算引擎(MapReduce) 性能指標(biāo) | WordCount:平均每節(jié)點(diǎn)處理能力(GB/分鐘) | 6GB/分鐘 | 10節(jié)點(diǎn)集群; |
Terasort:平均每節(jié)點(diǎn)處理能力(GB/分鐘) | 5GB/分鐘 | ||
K-means:平均每節(jié)點(diǎn)處理能力(MB/分鐘) | 400MB/分鐘 | ||
Bayesian:平均每節(jié)點(diǎn)處理能力(MB/分鐘) | 12MB/分鐘 | ||
Hive性能指標(biāo) | 處理能力-HiveAggregation:平均每節(jié)點(diǎn)處理能力(GB/分鐘) | 5GB/分鐘 | |
處理能力-HiveJoin:平均每節(jié)點(diǎn)處理能力(GB/分鐘) | 2GB/分鐘 | ||
HBase性能指標(biāo) | 100%隨機(jī)讀:平均每節(jié)點(diǎn)讀取記錄條數(shù)(每條記錄1KB),響應(yīng)時(shí)間小于50MS | 5000 Records/s | |
100%隨機(jī)寫:平均每節(jié)點(diǎn)寫入記錄條數(shù)(每條記錄1KB),響應(yīng)時(shí)間小于50MS | 40,000 Records/s | ||
順序掃描:平均每節(jié)點(diǎn)scan記錄條數(shù)(每條記錄1KB),響應(yīng)時(shí)間小于50MS | 60,000 Records/s |