另类专区亚洲欧美在线观看,欧美日本在线观看,岛国视频在线免费观看

導讀：

如同我們?nèi)ツ?2月在 Flink Forward China 峰會所約，阿里巴巴內(nèi)部 Flink 版本 Blink 將于 2019 年 1 月底正式開源。今天，我們終于等到了這一刻。

阿里資深技術(shù)專家大沙，將為大家詳細介紹本次開源的Blink主要功能和優(yōu)化點，希望與業(yè)界同仁共同攜手，推動Flink社區(qū)進一步發(fā)展。

Blink on GitHub

https://github.com/apache/flink/tree/blink

Blink簡介

Apache Flink是德國柏林工業(yè)大學的幾個博士生和研究生從學校開始做起來的項目，早期叫做Stratosphere。2014年，StratoSphere項目中的核心成員從學校出來開發(fā)了Flink，同時將Flink計算的主流方向定位為流計算，并在同年將Flink捐贈Apache，后來快速孵化成為Apache的頂級項目?，F(xiàn)在Flink是業(yè)界公認的最好的大數(shù)據(jù)流計算引擎。

阿里巴巴在2015年開始嘗試使用Flink。但是阿里的業(yè)務(wù)體量非常龐大，挑戰(zhàn)也很多。彼時的Flink不管是規(guī)模還是穩(wěn)定性尚未經(jīng)歷實踐，成熟度有待商榷。為了把這么大的業(yè)務(wù)體量支持好，我們不得不在Flink之上做了一系列的改進，所以阿里巴巴維護了一個內(nèi)部版本的Flink，它的名字叫做Blink。

基于Blink的計算平臺于2016年正式上線。截至目前，阿里絕大多數(shù)的技術(shù)部門都在使用Blink。Blink一直在阿里內(nèi)部錯綜復雜的業(yè)務(wù)場景中鍛煉成長著。對于內(nèi)部用戶反饋的各種性能、資源使用率、易用性等諸多方面的問題，Blink都做了針對性的改進。雖然現(xiàn)在Blink在阿里內(nèi)部用的最多的場景主要還是在流計算，但是在批計算場景也有不少業(yè)務(wù)上線使用了。例如，在搜索和推薦的算法業(yè)務(wù)平臺中，它使用Blink同時進行流計算和批處理。Blink被用來實現(xiàn)了流批一體化的樣本生成和特征抽取這些流程，能夠處理的特征數(shù)達到了數(shù)千億，而且每秒鐘處理數(shù)億條消息。在這個場景的批處理中，我們單個作業(yè)處理的數(shù)據(jù)量已經(jīng)超過400T，并且為了節(jié)省資源，我們的批處理作業(yè)是和流計算作業(yè)以及搜索的在線引擎運行在同樣的機器上。所以大家可以看到流批一體化已經(jīng)在阿里巴巴取得了極大的成功，我們希望這種成功和阿里巴巴內(nèi)部的經(jīng)驗都能夠帶回給社區(qū)。

Blink開源的背景

其實從我們選擇Flink的第一天開始我們就一直和社區(qū)緊密合作。過去的這幾年我們也一直在把阿里對Flink 的改進推回社區(qū)。從2016年開始我們已經(jīng)將流計算SQL的大部分功能，針對runtime的穩(wěn)定性和性能優(yōu)化做的若干重要設(shè)計都推回了社區(qū)。但是Blink本身發(fā)展迭代的速度非?？欤鐓^(qū)有自己的步伐，很多時候可能無法把我們的變更及時推回去。對于社區(qū)來說，一些大的功能和重構(gòu)，需要達成共識后，才能被接受，這樣才能更好地保證開源項目的質(zhì)量，但是同時就會導致推入的速度變得相對較慢。經(jīng)過這幾年的開發(fā)迭代，我們這邊和社區(qū)之間的差距已經(jīng)變得比較大了。

Blink 有一些很好的新功能，比如性能優(yōu)越的批處理功能，在社區(qū)的版本是沒有的。在過去這段時間里，我們不斷聽到有人在詢問Blink的各種新功能。期望Blink盡快開源的呼聲越來越大。我們一直在思考如何開源的問題，一種方案就是和以前一樣，繼續(xù)把各種功能和優(yōu)化分解，逐個和社區(qū)討論，慢慢地推回Flink。但這顯然不是大家所期待的。另一個方案，就是先完整的盡可能的多的把代碼開源，讓社區(qū)的開發(fā)者能夠盡快試用起來。第二個方案很快收到社區(qū)廣大用戶的支持。因此，從2018年年中開始我們就開始做開源的相關(guān)準備。經(jīng)過半年的努力，我們終于把大部分Blink的功能梳理好，開源了出來。

Blink開源的方式

我們把代碼貢獻出來，是為了讓大家能先嘗試一些他們感興趣的功能。Blink永遠不會單獨成為一個獨立的開源項目來運作，他一定是Flink的一部分。開源后我們期望能找到辦法以最快的方式將Blink merge到Flink中去。Blink開源只有一個目的，就是希望 Flink 做得更好。Apache Flink 是一個社區(qū)項目，Blink以什么樣的形式進入 Flink 是最合適的，怎么貢獻是社區(qū)最希望的方式，我們都要和社區(qū)一起討論。

在過去的一段時間內(nèi)，我們在Flink社區(qū)征求了廣泛的意見，大家一致認為將本次開源的Blink代碼作為Flink的一個branch直接推回到ApacheFlink項目中是最合適的方式。并且我們和社區(qū)也一起討論規(guī)劃出一套能夠快速merge Blink到Flink master中的方案(具體細節(jié)可以查看Flink社區(qū)正在討論的FLIP32)。我們期望這個merge能夠在很短的時間內(nèi)完成。這樣我們之后的Machine Learning等其他新功能就可以直接推回到Flink master。相信用不了多久，F(xiàn)link 和 Blink 就完全合二為一了。在那之后，阿里巴巴將直接使用Flink用于生產(chǎn)，并同時協(xié)助社區(qū)一起來維護Flink。

本次開源的Blink的主要功能和優(yōu)化點

本次開源的Blink代碼在Flink1.5.1版本之上，加入了大量的新功能，以及在性能和穩(wěn)定性上的各種優(yōu)化。主要貢獻包括，阿里巴巴在流計算上積累的一些新功能和性能的優(yōu)化，一套完整的(能夠跑通全部TPC-H/TPC-DS，能夠讀取Hive meta和data)高性能Batch SQL，以及一些以提升易用性為主的功能(包括支持更高效的interactive programming, 與zeppelin更緊密的結(jié)合, 以及體驗和性能更佳的Flink web)。未來我們還將繼續(xù)給Flink貢獻在AI，IoT以及其他新領(lǐng)域的功能和優(yōu)化。更多的關(guān)于這一版本Blink release的細節(jié)，請參考Blink代碼根目錄下的README.md文檔。下面，我來分模塊介紹下Blink主要的新的功能和優(yōu)化點。

● Runtime

為了更好的支持batch processing，以及解決阿里巴巴大規(guī)模生產(chǎn)場景中遇到的各種挑戰(zhàn)，Blink對Runtime架構(gòu)、效率、穩(wěn)定性方面都做了大量改進。在架構(gòu)方面，首先Blink引入了Pluggable ShuffleArchitecture，開發(fā)者可以根據(jù)不同的計算模型或者新硬件的需要實現(xiàn)不同的shuffle策略進行適配。此外Blink還引入新的調(diào)度架構(gòu)，容許開發(fā)者根據(jù)計算模型自身的特點定制不同調(diào)度器。為了優(yōu)化性能，Blink可以讓算子更加靈活的chain在一起，避免了不必要的數(shù)據(jù)傳輸開銷。在Pipeline Shuffle模式中，使用了ZeroCopy減少了網(wǎng)絡(luò)層內(nèi)存消耗。在BroadCast Shuffle模式中，Blink優(yōu)化掉了大量的不必要的序列化和反序列化開銷。

此外，Blink提供了全新的JM FailOver機制，JM發(fā)生錯誤之后，新的JM會重新接管整個JOB而不是重啟JOB，從而大大減少了JM FailOver對JOB的影響。最后，Blink也開發(fā)了對Kubernetes的支持。不同于Standalone模式在Kubernetes上的拉起方式，在基于Flink FLIP6的架構(gòu)上基礎(chǔ)之上，Blink根據(jù)job的資源需求動態(tài)的申請/釋放Pod來運行TaskExecutor，實現(xiàn)了資源彈性，提升了資源的利用率。

●SQL/TableAPI

SQL/TableAPI架構(gòu)上的重構(gòu)和性能的優(yōu)化是Blink本次開源版本的一個重大貢獻。首先，我們對SQL engine的架構(gòu)做了較大的調(diào)整。提出了全新的Query Processor(QP)，它包括了一個優(yōu)化層(Query Optimizer)和一個算子層(Query Executor)。這樣一來，流計算和批計算的在這兩層大部分的設(shè)計工作就能做到盡可能的復用。

另外，SQL和TableAPI的程序最終執(zhí)行的時候?qū)⒉粫g到DataStream和DataSet這兩個API上，而是直接構(gòu)建到可運行的DAG上來，這樣就使得物理執(zhí)行算子的設(shè)計不完全依賴底層的API，有了更大的靈活度，同時執(zhí)行代碼也能夠被靈活的codegen出來。唯一的一個影響就是這個版本的SQL和TableAPI不能和DataSet這個API進行互相轉(zhuǎn)換，但仍然保留了和DataStream API互相轉(zhuǎn)換的能力(將DataStream注冊成表，或?qū)able轉(zhuǎn)成DataStream后繼續(xù)操作)。未來，我們計劃把dataset的功能慢慢都在DataStream和TableAPI上面實現(xiàn)。到那時DataStream和SQL以及tableAPI一樣，是一個可以同時描述bounded以及unbounded processing的API。

除了架構(gòu)上的重構(gòu)，Blink還在具體實現(xiàn)上做了較多比較大的重構(gòu)。首先，Blink引入了二進制的數(shù)據(jù)結(jié)構(gòu)BinaryRow，極大的減少了數(shù)據(jù)存儲上的開銷以及數(shù)據(jù)在序列化和反序列化上計算的開銷。其次，在算子的實現(xiàn)層面，Blink在更廣范圍內(nèi)引入了CodeGen技術(shù)。由于預先知道算子需要處理的數(shù)據(jù)的類型，在QP層內(nèi)部就可以直接生成更有針對性更高效的執(zhí)行代碼。

Blink的算子會動態(tài)的申請和使用資源，能夠更好的利用資源，提升效率，更加重要的是這些算子對資源有著比較好的控制，不會發(fā)生OutOfMemory 的問題。此外，針對流計算場景，Blink加入了miniBatch的執(zhí)行模式，在aggregate、join等需要和state頻繁交互且往往又能先做部分reduce的場景中，使用miniBatch能夠極大的減少IO，從而成數(shù)量級的提升性能。除了上面提到的這些重要的重構(gòu)和功能點，Blink還實現(xiàn)了完整的SQL DDL，帶emit策略的流計算DML，若干重要的SQL功能，以及大量的性能優(yōu)化策略。

有了上面提到的諸多架構(gòu)和實現(xiàn)上的重構(gòu)。Blink的SQL/tableAPI在功能和性能方面都取得了脫胎換骨的變化。在批計算方面，首先Blink batch SQL能夠完整的跑通TPC-H和TPC-DS，且性能上有著極大的提升。如上圖所示，是這次開源的Blink版本和spark 2.3.1的TPC-DS的benchmark性能對比。柱狀圖的高度代表了運行的總時間，高度越低說明性能越好?？梢钥闯觯珺link在TPC-DS上和Spark相比有著非常明顯的性能優(yōu)勢。而且這種性能優(yōu)勢隨著數(shù)據(jù)量的增加而變得越來越大。在實際的場景這種優(yōu)勢已經(jīng)超過 Spark的三倍。在流計算性能上我們也取得了類似的提升。我們線上的很多典型作業(yè)，它的性能是原來的3到5倍。在有數(shù)據(jù)傾斜的場景，以及若干比較有挑戰(zhàn)的TPC-H query，流計算性能甚至得到了數(shù)十倍的提升。

除了標準的Relational SQL API。TableAPI在功能上是SQL的超集，因此在SQL上所有新加的功能，我們在tableAPI也添加了相對應(yīng)的API。除此之外，我們還在TableAPI上引入了一些新的功能。其中一個比較重要是cache功能。在批計算場景下，用戶可以根據(jù)需要來cache計算的中間結(jié)果，從而避免不必要的重復計算。它極大的增強了interactive programming體驗。我們后續(xù)會在tableAPI上添加更多有用的功能。其實很多新功能已經(jīng)在社區(qū)展開討論并被社區(qū)接受，例如我們在tableAPI增加了對一整行操作的算子map/flatMap/aggregate/flatAggregate(Flink FLIP29)等等。

●Hive的兼容性

我們這次開源的版本實現(xiàn)了在元數(shù)據(jù)(meta data)和數(shù)據(jù)層將Flink和Hive對接和打通。國內(nèi)外很多公司都還在用 Hive 在做自己的批處理。對于這些用戶，現(xiàn)在使用這次Blink開源的版本，就可以直接用Flink SQL去查詢Hive的數(shù)據(jù)，真正能夠做到在Hive引擎和Flink引擎之間的自由切換。

為了打通元數(shù)據(jù)，我們重構(gòu)了Flink catalog的實現(xiàn)，并且增加了兩種catalog，一個是基于內(nèi)存存儲的FlinkInMemoryCatalog，另外一個是能夠橋接Hive metaStore的HiveCatalog。有了這個HiveCatalog，F(xiàn)link作業(yè)就能讀取Hive的metaData。為了打通數(shù)據(jù)，我們實現(xiàn)了HiveTableSource，使得Flink job可以直接讀取Hive中普通表和分區(qū)表的數(shù)據(jù)。因此，通過這個版本，用戶可以使用Flink SQL讀取已有的Hive meta和data，做數(shù)據(jù)處理。未來我們將在Flink上繼續(xù)加大對Hive兼容性的支持，包括支持Hive特有的query，data type，和Hive UDF等等。

●Zeppelin for Flink

為了提供更好的可視化和交互式體驗，我們做了大量的工作讓Zeppelin能夠更好的支持Flink。這些改動有些是在Flink上的，有些是在Zeppelin上的。在這些改動全部推回Flink和Zeppelin社區(qū)之前，大家可以使用這個Zeppelin image(具體細節(jié)請參考Blink代碼里的docs/quickstart/zeppelin_quickstart.md)來測試和使用這些功能。這個用于測試的Zeppelin版本，首先很好的融合和集成了Flink的多種運行模式以及運維界面。使用文本SQL和tableAPI可以自如的查詢Flink的static table和dynamic table。

此外，針對Flink的流計算的特點，這一版Zeppelin也很好的支持了savepoint，用戶可以在界面上暫停作業(yè)，然后再從savepoint恢復繼續(xù)運行作業(yè)。在數(shù)據(jù)展示方面，除了傳統(tǒng)的數(shù)據(jù)分析界面，我們也添加了流計算的翻牌器和時間序列展示等等功能。為了方便用戶試用，我們在這一版zeppelin中提供3個built-in的Flink tutorial的例子: 一個是做StreamingETL的例子, 另外兩個分別是做Flink Batch,Flink Stream的基礎(chǔ)樣例。

●Flink Web

我們對Flink Web的易用性與性能等多個方面做了大量的改進，從資源使用、作業(yè)調(diào)優(yōu)、日志查詢等維度新增了大量功能，使得用戶可以更方便的對Flink作業(yè)進行運維。在資源使用方面，新增了Cluster、TaskManager與Job三個級別的資源信息，使得資源的申請與使用情況一目了然。作業(yè)的拓撲關(guān)系及數(shù)據(jù)流向可以追溯至 Operator 級別，Vertex 增加了InQueue，OutQueue等多項指標，可以方便的追蹤數(shù)據(jù)的反壓、過濾及傾斜情況。TaskManager 和 JobManager 的日志功能得到大幅度加強，從Job、Vertex、SubTask 等多個維度都可以關(guān)聯(lián)至對應(yīng)日志，提供多日志文件訪問入口，以及分頁展示查詢和日志高亮功能。

另外，我們使用了較新的Angular 7.0 對Flink web進行了全面重構(gòu)，頁面運行性能有了一倍以上的提升。在大數(shù)據(jù)量情況下也不會發(fā)生頁面卡死或者卡頓情況。同時對頁面的交互邏輯進行了整體優(yōu)化，絕大部分關(guān)聯(lián)信息在單個頁面就可以完成查詢和比對工作，減少了大量不必要的跳轉(zhuǎn)。

未來的規(guī)劃

Blink邁出了全面開源的第一步，接下來我們會和社區(qū)合作，盡可能以最快的方式將Blink的功能和性能上的優(yōu)化merge回Flink。本次的開源版本一方面貢獻了Blink多年在流計算的積累，另一方面又重磅推出了在批處理上的成果。接下來，我們會持續(xù)給Flink社區(qū)貢獻其他方面的功能。我們期望每過幾個月就能看到技術(shù)上有一個比較大的亮點貢獻到社區(qū)。下一個亮點應(yīng)該是對機器學習的支持。要把機器學習支持好，有一系列的工作要做，包括引擎的功能，性能，和易用性。這里面大部分的工作我們已經(jīng)開發(fā)完成，并且很多功能都已經(jīng)在阿里巴巴內(nèi)部服務(wù)上線了。

除了技術(shù)上創(chuàng)新以及新功能之外，F(xiàn)link的易用性和外圍生態(tài)也非常重要。我們已經(jīng)啟動了若干這方面的項目，包括Python以及Go等多語言支持，F(xiàn)link集群管理，Notebook，以及機器學習平臺等等。這些項目有些會成為Flink自身的一部分貢獻回社區(qū)，有些不是。但它們都基于Flink，是Flink生態(tài)的一個很好的補充。獨立于Flink之外的那些項目，我們都也在認真的考慮開源出來?？傊?，Blink在開源的第一天起，就已經(jīng)完全all-in的融入了Flink社區(qū)，我們希望所有的開發(fā)者看到我們的誠意和決心。

未來，無論是功能還是生態(tài)，我們都會在Flink社區(qū)加大投入，我們也將投入力量做 Flink 社區(qū)的運營，讓 Flink 真正在中國、乃至全世界大規(guī)模地使用起來。我們衷心的希望更多的人加入，一起把Apache Flink開源社區(qū)做得更好!

申請創(chuàng)業(yè)報道，分享創(chuàng)業(yè)好點子。點擊此處，共同探討創(chuàng)業(yè)新機遇！

當前位置：首頁 > 科技 > 互聯(lián)網(wǎng) > 正文

阿里正式向Apache Flink貢獻Blink源碼

相關(guān)文章

阿里剛換帥，京東忙換將：新時代號角吹響

阿里巴巴變革，盒馬“一馬當先”

阿里重回創(chuàng)業(yè)時代

阿里組織變革新階段：蓄力拉弓，一箭向前

阿里巴巴：改革穩(wěn)定靠人，銳意進取也靠人

熱門排行

信息推薦

熱門標簽