在數(shù)字經(jīng)濟時代,數(shù)據(jù)是重要的資源要素;同時,新的數(shù)據(jù)又在源源不斷地產(chǎn)生,企業(yè)面臨的一個基本問題就是如何管理和利用這些數(shù)據(jù),這對傳統(tǒng)的數(shù)據(jù)處理方法與分析框架提出了新的訴求和挑戰(zhàn),也是全球業(yè)界與學(xué)界為關(guān)心的問題。為了滿足大數(shù)據(jù)時代對信息的快速處理的需求,一個分布式的開源計算框架Apache Spark應(yīng)運而生。經(jīng)過十年的發(fā)展,Spark已經(jīng)成為目前大數(shù)據(jù)處理的標桿,在整個業(yè)界得到了廣泛的使用。對大數(shù)據(jù)工程師來說,用Spark構(gòu)建數(shù)據(jù)管道無疑是很好的選擇,而對數(shù)據(jù)科學(xué)家來說,Spark也是高效的數(shù)據(jù)探索工具。
本書基于Spark發(fā)行版2.4.4寫作而成,包含大量的實例與一個完整項目,技術(shù)理論與實戰(zhàn)相結(jié)合,層次分明,循序漸進。本書不僅介紹了如何開發(fā)Spark應(yīng)用的基礎(chǔ)內(nèi)容,包括Spark架構(gòu)、Spark編程、SparkSQL、Spark調(diào)優(yōu)等,還探討了Structured Streaming、Spark機器學(xué)習(xí)、Spark圖挖掘、Spark深度學(xué)習(xí)、Alluxio系統(tǒng)等高級主題,同時完整實現(xiàn)了一個企業(yè)背景調(diào)查系統(tǒng),借鑒了數(shù)據(jù)湖與Lambda架構(gòu)的思想,涵蓋了批處理、流處理應(yīng)用開發(fā),并加入了一些開源組件來滿足業(yè)務(wù)需求。學(xué)習(xí)該系統(tǒng)可以使讀者從實戰(zhàn)中鞏固所學(xué),并將技術(shù)理論與應(yīng)用實戰(zhàn)融會貫通。
本書適合準備學(xué)習(xí)Spark的開發(fā)人員和數(shù)據(jù)分析師,以及準備將Spark應(yīng)用到實際項目中的開發(fā)人員和管理人員閱讀,也適合計算機相關(guān)專業(yè)的高年級本科生和研究生學(xué)習(xí)和參考,對于具有一定的Spark使用經(jīng)驗并想進一步提升的數(shù)據(jù)科學(xué)從業(yè)者也是很好的參考資料。
本書基于Spark發(fā)行版2.4.4寫作而成,包含大量的實例與一個完整項目,層次分明,循序漸進。全書分為3部分,涵蓋了技術(shù)理論與實戰(zhàn),讀者可以從實戰(zhàn)中鞏固學(xué)習(xí)到的知識。第一部分主要圍繞BDAS(伯克利數(shù)據(jù)分析棧),不僅介紹了如何開發(fā)Spark應(yīng)用的基礎(chǔ)內(nèi)容,還介紹了Structured Streaming、Spark機器學(xué)習(xí)、Spark圖挖掘、Spark深度學(xué)習(xí)等高級主題,此外還介紹了Alluxio系統(tǒng)。第二部分實現(xiàn)了一個企業(yè)背景調(diào)查系統(tǒng),比較新穎的是,該系統(tǒng)借鑒了數(shù)據(jù)湖與Lambda架構(gòu)的思想,涵蓋了批處理、流處理應(yīng)用開發(fā),并加入了一些開源組件來滿足需求,既是對本書第一部分很好的鞏固,又完整呈現(xiàn)了一個實時大數(shù)據(jù)應(yīng)用的開發(fā)過程。第三部分是對全書的總結(jié)和展望。
本書適合準備學(xué)習(xí)Spark的開發(fā)人員和數(shù)據(jù)分析師,以及準備將Spark應(yīng)用到實際項目中的開發(fā)人員和管理人員閱讀,也適合計算機相關(guān)專業(yè)的高年級本科生和研究生學(xué)習(xí)和參考,對于具有一定的Spark使用經(jīng)驗并想進一步提升的數(shù)據(jù)科學(xué)從業(yè)者也是很好的參考資料。
Spark海量數(shù)據(jù)處理:技術(shù)詳解與平臺實戰(zhàn)是2019年由人民郵電出版社出版,作者范東來。
溫馨提示:
1.本電子書已獲得正版授權(quán),由出版社通過知傳鏈發(fā)行。
2.該電子書為虛擬物品,付費之后概不接收任何理由退款。電子書內(nèi)容僅支持在線閱讀,不支持下載。
3.您在本站購買的閱讀使用權(quán)僅限于您本人閱讀使用,您不得/不能給任何第三方使用,由此造成的一切相關(guān)后果本平臺保留向您追償索賠的權(quán)利!版權(quán)所有,后果自負!
得書感謝您對《Spark海量數(shù)據(jù)處理:技術(shù)詳解與平臺實戰(zhàn)》關(guān)注和支持,如本書內(nèi)容有不良信息或侵權(quán)等情形的,請聯(lián)系本網(wǎng)站。