<ruby id="h6500"><table id="h6500"></table></ruby>
    1. <ruby id="h6500"><video id="h6500"></video></ruby>
          1. <progress id="h6500"><u id="h6500"><form id="h6500"></form></u></progress>

            大數據平臺測試方法

            發(fā)表于:2023-07-01來(lái)源:云棲社區作者:北斗云點(diǎn)擊數: 標簽:
            本文講解了大數據平臺測試流程,大數據平臺測試工具,測試工具BigDataBench,測試工具TPCx-HS Kit等希望能對您有所幫助。

            一.大數據平臺測試簡(jiǎn)述

            大數據平臺測試包括2部分:基礎能力測試和性能測試

            Ⅰ).基礎能力測試

            大數據平臺的基本功能和數據的導入導出對SQL任務(wù)、NoSQL任務(wù)、機器學(xué)習、批處理任務(wù)的支持

            大數據平臺是否能夠通過(guò)界面的形式方便用戶(hù)進(jìn)行非運行維護,主要包括集群的安裝、監控、配置、操作等

            大數據平臺是否能夠提供基本的安全方案

            a).是否具備認證功能以防止惡意訪(fǎng)問(wèn)和攻擊

            b).是否能夠進(jìn)行細粒度的權限管理

            c).是否能夠提供審計和數據加密功能

            大數據平臺是否具備高可用的機制,防止機器的失效帶來(lái)的任務(wù)失敗以及數據丟失

            大數據平臺是否能夠支持機器快速平滑地擴展和縮容時(shí)帶來(lái)線(xiàn)性的計算能力

            大數據平臺是否能夠支持多個(gè)調用接口以及對SQL語(yǔ)法的支持情況

            大數據平臺是否能夠根據隊列、用戶(hù)的權重來(lái)細粒度地分配計算資源

            Ⅱ).性能測試

            基準測試:數據生成、負載選擇和明確測試指標等內容

            性能測試:基準測試之上的擴展

            二.大數據平臺測試流程

            Ⅰ).數據生成

            BDGS: 能夠快速生成保持真實(shí)數據特性的文本、表和圖數據的數據生成工具

            BDGS構造方法

            a).數據篩選:選取代表性的真實(shí)數據集和相應的建模方法或工具

            b).原始數據處理:對真實(shí)數據采樣并建模,提取數據特性

            c).數據生成:通過(guò)參數控制數據規模和并行度

            d).格式轉化:根據負載的輸入需求轉換生成數據的格式

            Ⅱ).負載選擇

            負載選擇策略: 負載需覆蓋大數據處理平臺的主要組件即分布式計算框架、分布式文件系統和分布式存儲的能力

            Ⅲ).測試指標

            主要從性能、能耗、性?xún)r(jià)比和可用性4個(gè)維度來(lái)測試對比平臺性能

            三.大數據平臺測試工具

            Ⅰ).平臺單組件測試

            測試應用單一、效率高、成本低,但無(wú)法全面衡量大數據平臺性能

            Ⅱ).綜合平臺測試

            覆蓋面廣,可以較全面測試衡量大數據平臺不同類(lèi)型任務(wù)的性能,通用性好

            測試工具BigDataBench:

            a).概念:是一個(gè)跨系統、體系結構、數據管理 3個(gè)領(lǐng)域的大數據基準測試開(kāi)源程序集

            b).應用領(lǐng)域:搜索引擎、電子商務(wù)、社交網(wǎng)絡(luò )、多媒體、生物信息

            c).負載類(lèi)型:離線(xiàn)分析、交互式分析、在線(xiàn)服務(wù)、Nosql

            d).數據類(lèi)型:結構化、半結構化、非結構化

            測試工具Hibench:

            a).概念:是一個(gè)大數據基準測試套件,可幫助評估大數據框架的速度,吞吐量和系統資源利用率

            b).測試范圍:HadoopBench、SparkBench、StormBench、FlinkBench、GearpumpBench、機器學(xué)習、網(wǎng)頁(yè)搜索

            c).負載類(lèi)型:實(shí)時(shí)場(chǎng)景、離線(xiàn)場(chǎng)景

            d).數據類(lèi)型:結構化、半結構化

            e).功能模塊:對于hive:(aggregation,scan,join)、排序(sort,TeraSort)、大數據基本算法(wordcount,pagerank,nutchindex)、機器學(xué)習算法(kmeans,bayes)、集群調度(sleep)、吞吐(dfsio)、5.0版本的流測試

            測試工具TPCx-HS Kit

            a).概念:第一個(gè)標準化的大數據基準測試,旨在對Hadoop集群進(jìn)行壓力測試

            b).囊括模塊:HSGen數據生成器、HSDataCheck檢查數據集和副本的符合性、HSSort數據排序、HSValidatate排序后的數據校驗

            c).測試指標:性能、價(jià)格性能和可用性

            d).負載類(lèi)型:實(shí)時(shí)場(chǎng)景、離線(xiàn)場(chǎng)景

            測試工具BSMA

            a).概念:基于Yahoo的YCSB的大數據性能測試工具

            b).測試場(chǎng)景:社交網(wǎng)絡(luò )查詢(xún)、熱點(diǎn)查詢(xún)、時(shí)間線(xiàn)查詢(xún)

            c).負載類(lèi)型:離線(xiàn)分析、Nosql

            d).測試指標:吞吐量、延時(shí)、可伸縮性

            Ⅲ).應用領(lǐng)域端到端測試

            可以與企業(yè)場(chǎng)景的實(shí)際業(yè)務(wù)場(chǎng)景結合,覆蓋企業(yè)大數據業(yè)務(wù)的全流程模擬測試

            測試工具BigBench

            a).概念:于2016年2月被TPC委員會(huì )接受以后被命名為T(mén)PCx-BB,在此之前叫BigBench;TPCx-BB性能評估標準有兩個(gè),一是根據軟硬件性能評估,二是根據軟硬件性?xún)r(jià)比評估

            b).測試領(lǐng)域:零售商

            c).負載類(lèi)型:離線(xiàn)分析

            d).數據類(lèi)型:結構化、半結構化、非結構化

            四.大數據平臺測試用例

            Ⅰ).平臺基準測試用例

            主要是從性能的角度衡量大數據平臺,包括數據生成、負載選擇和明確測試指標等內容

            Ⅱ).平臺性能測試用例

            在基準測試的基礎上擴展測試內容,增加SQL任務(wù)測試比重

            Ⅲ).平臺基礎能力測試用例

            原文轉自:https://developer.aliyun.com/article/712913

            老湿亚洲永久精品ww47香蕉图片_日韩欧美中文字幕北美法律_国产AV永久无码天堂影院_久久婷婷综合色丁香五月
              <ruby id="h6500"><table id="h6500"></table></ruby>
              1. <ruby id="h6500"><video id="h6500"></video></ruby>
                    1. <progress id="h6500"><u id="h6500"><form id="h6500"></form></u></progress>