1. 創(chuàng)業(yè)頭條
  2. 前沿領域
  3. 大數據
  4. 正文

易觀發(fā)布新一代IOTA架構去ETL化 引領大數據3.0時代

 2018-04-27 12:14  來源:互聯(lián)網  我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

大數據浪潮推動科技發(fā)展,從大數據1.0的BI/Datawarehouse時代,經歷過大數據2.0的Web/APP時代,屬于IOT的大數據3.0時代已然來臨。近日,Analysys易觀發(fā)布IOTA整體技術架構,為企業(yè)進行數字用戶分析和營銷貢獻了新工具。

早期大數據平臺利用Lambda數據架構,將收集來的數據在流式計算平臺和批量數據處理離線平臺進行計算,主要解決實時數據處理需求和批量離線處理需求。穩(wěn)定性高、成本可控且便于晚間閑時錯峰計算的Lambda架構支撐了起步時期的數據行業(yè),但由于實時與批量計算結果不一致引起的數據口徑問題、ETL批量計算在計算窗口內無法完成、數據源變化后修改開發(fā)周期長、服務器存儲大等缺陷,后期的Lambda數據架構越來越無法適應飛速擴增的數據處理需求。

Lambda典型架構

在Lambda之后,Kappa架構成為主流,核心思想是通過改進流計算系統(tǒng)來解決數據全量處理的問題,使得實時計算和批處理過程使用同一套代碼,并且只有在必要的時候才會對歷史數據進行重復計算。雖然比起Lambda,Kappa結構能夠將實時和離線代碼統(tǒng)一起來,既方便維護又解決了數據口徑不一致問題,但其缺點也很明顯:流式處理對于歷史數據的高吞吐量力不從心,開發(fā)周期長,服務器成本浪費嚴重。

而在IOT大潮下,智能手機、PC、智能硬件設備的計算能力越來越強,而業(yè)務需求要求數據實時響應需求能力也越來越強,過去傳統(tǒng)的中心化、非實時化數據處理的思路已經不適應現(xiàn)在的大數據分析需求,Analysys易觀提出新一代的大數據IOTA架構來解決上述問題,整體思路是設定標準數據模型,通過邊緣計算技術把所有的計算過程分散在數據產生、“去ETL化”、計算和查詢過程當中,以統(tǒng)一的數據模型貫穿始終,從而提高整體的預算效率,同時滿足即時計算的需要,可以使用各種Ad-hoc Query來查詢底層數據:

凝聚了Analysys易觀團隊多年心血的IOTA架構,解決了傳統(tǒng)技術中ETL和相關開發(fā)的痛點,提高了整體數據分析效率;Ad-hoc即時查詢功能使用戶無需多等就能直接查詢到前幾秒發(fā)生的事件;邊緣計算技術解除了中央端集中處理的限制,將計算過程分散到數據產生、存儲和查詢端,同時確??蛻舳藗魉蛿祿r能馬上進行反饋。

為了驗證IOTA架構,Analysys易觀也自主設計并實現(xiàn)了“秒算”引擎,目前支持易觀內部月活5.5億設備端同時進行計算。此外基于“秒算”引擎,Analysys易觀研發(fā)出了可以獨立部署在企業(yè)客戶內、進行數字用戶分析和營銷的“易觀方舟”精細化運營產品。

Analysys易觀認為,在大數據3.0時代,Lambda大數據架構已經無法滿足企業(yè)用戶日常大數據分析和精益運營的需要,去ETL化的IOTA大數據架構才是未來。Lambda大數據架構為大數據分析行業(yè)提供了創(chuàng)新思維和技術基礎,Analysys易觀以此為基礎,將繼續(xù)致力于互聯(lián)網企業(yè)的用戶與產品運營。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
大數據應用

相關文章