亚洲系列一区中文字幕,亚洲成a人片在线不卡一二三区,亚洲av午夜福利精品一区人妖,亚洲中文字幕在线,亚洲精品无码mv在线观看

基于Hadoop與Spark的大數(shù)據(jù)開發(fā)實(shí)戰(zhàn) 電子書

基于Hadoop與Spark的大數(shù)據(jù)開發(fā)實(shí)戰(zhàn)

內(nèi)容簡介

大數(shù)據(jù)技術(shù)讓我們以一種前所未有的方式,對海量數(shù)據(jù)進(jìn)行分析,從中獲得有巨大價值的產(chǎn)品和服務(wù),最終形成變革之力。本書圍繞Hadoop和Spark兩個主流大數(shù)據(jù)技術(shù)進(jìn)行講解,主要內(nèi)容包括Hadoop環(huán)境配置、Hadoop分布式文件系統(tǒng)(HDFS)、Hadoop分布式計算框架MapReduce、Hadoop資源調(diào)度框架YARN與Hadoop新特性、Hadoop分布式數(shù)據(jù)庫HBase、數(shù)據(jù)倉庫Hive、大數(shù)據(jù)離線處理輔助系統(tǒng)、Spark Core、Spark SQL、Spark Streaming等知識。

本書緊密結(jié)合實(shí)際應(yīng)用,運(yùn)用大量案例說明和實(shí)踐,提煉含金量十足的開發(fā)經(jīng)驗(yàn)。另外,本書配以多元的學(xué)習(xí)資源和支持服務(wù),包括視頻教程、案例素材下載、學(xué)習(xí)交流社區(qū)、討論組等學(xué)習(xí)內(nèi)容,為讀者帶來全方位的學(xué)習(xí)體驗(yàn)。

章節(jié)目錄

展開全部

基于Hadoop與Spark的大數(shù)據(jù)開發(fā)實(shí)戰(zhàn)是2018年由人民郵電出版社出版,作者肖睿 丁科 吳剛山。

溫馨提示:
1.本電子書已獲得正版授權(quán),由出版社通過知傳鏈發(fā)行。
2.該電子書為虛擬物品,付費(fèi)之后概不接收任何理由退款。電子書內(nèi)容僅支持在線閱讀,不支持下載。
3.您在本站購買的閱讀使用權(quán)僅限于您本人閱讀使用,您不得/不能給任何第三方使用,由此造成的一切相關(guān)后果本平臺保留向您追償索賠的權(quán)利!版權(quán)所有,后果自負(fù)!
得書感謝您對《基于Hadoop與Spark的大數(shù)據(jù)開發(fā)實(shí)戰(zhàn)》關(guān)注和支持,如本書內(nèi)容有不良信息或侵權(quán)等情形的,請聯(lián)系本網(wǎng)站。

你可能喜歡
大數(shù)據(jù)技術(shù)基礎(chǔ)——基于Hadoop與Spark 電子書
將Hadoop和Spark組合起來進(jìn)行剖析,呈現(xiàn)完整的大數(shù)據(jù)技術(shù)方案。
HADOOP大數(shù)據(jù)開發(fā)實(shí)戰(zhàn) 電子書
Hadoop基礎(chǔ)教程,大數(shù)據(jù)技術(shù)原理與應(yīng)用教程,MapReduce框架入門實(shí)戰(zhàn)指南。
Spark海量數(shù)據(jù)處理:技術(shù)詳解與平臺實(shí)戰(zhàn) 電子書
在數(shù)字經(jīng)濟(jì)時代,數(shù)據(jù)是重要的資源要素;同時,新的數(shù)據(jù)又在源源不斷地產(chǎn)生,企業(yè)面臨的一個基本問題就是如何管理和利用這些數(shù)據(jù),這對傳統(tǒng)的數(shù)據(jù)處理方法與分析框架提出了新的訴求和挑戰(zhàn),也是全球業(yè)界與學(xué)界為關(guān)心的問題。為了滿足大數(shù)據(jù)時代對信息的快速處理的需求,一個分布式的開源計算框架Apache Spark應(yīng)運(yùn)而生。經(jīng)過十年的發(fā)展,Spark已經(jīng)成為目前大數(shù)據(jù)處理的標(biāo)桿,在整個業(yè)界得到了廣泛的使用。對大數(shù)據(jù)工程師來說,用Spark構(gòu)建數(shù)據(jù)管道無疑是很好的選擇,而對數(shù)據(jù)科學(xué)家來說,Spark也是高效的數(shù)據(jù)探索工具。 本書基于Spark發(fā)行版2.4.4寫作而成,包含大量的實(shí)例與一個完整項(xiàng)目,技術(shù)理論與實(shí)戰(zhàn)相結(jié)合,層次分明,循序漸進(jìn)。本書不僅介紹了如何開發(fā)Spark應(yīng)用的基礎(chǔ)內(nèi)容,包括Spark架構(gòu)、Spark編程、SparkSQL、Spark調(diào)優(yōu)等,還探討了Structured Streaming、Spark機(jī)器學(xué)習(xí)、Spark圖挖掘、Spark深度學(xué)習(xí)、Alluxio系統(tǒng)等高級主題,同時完整實(shí)現(xiàn)了一個企業(yè)背景調(diào)查系統(tǒng),借鑒了數(shù)據(jù)湖與Lambda架構(gòu)的思想,涵蓋了批處理、流處理應(yīng)用開發(fā),并加入了一些開源組件來滿足業(yè)務(wù)需求。學(xué)習(xí)該系統(tǒng)可以使讀者從實(shí)戰(zhàn)中鞏固所學(xué),并將技術(shù)理論與應(yīng)用實(shí)戰(zhàn)融會貫通。 本書適合準(zhǔn)備學(xué)習(xí)Spark的開發(fā)人員和數(shù)據(jù)分析師,以及準(zhǔn)備將Spark應(yīng)用到實(shí)際項(xiàng)目中的開發(fā)人員和管理人員閱讀,也適合計算機(jī)相關(guān)專業(yè)的高年級本科生和研究生學(xué)習(xí)和參考,對于具有一定的Spark使用經(jīng)驗(yàn)并想進(jìn)一步提升的數(shù)據(jù)科學(xué)從業(yè)者也是很好的參考資料。
Hadoop+Spark大數(shù)據(jù)技術(shù) 電子書
本書介紹Hadoop、Spark兩種大數(shù)據(jù)處理框架,共12章,內(nèi)容包括:Hadoop大數(shù)據(jù)開發(fā)環(huán)境、HDFS大數(shù)據(jù)分布式存儲、MapReduce分布式計算框架、HBase分布式數(shù)據(jù)庫、Scala基礎(chǔ)編程、Spark大數(shù)據(jù)處理框架、Windows環(huán)境下Spark綜合編程等。
Spark編程基礎(chǔ)(Scala版) 電子書
本書是廈門大學(xué)作者團(tuán)隊長期經(jīng)驗(yàn)總結(jié)的結(jié)晶,是在廈門大學(xué)《大數(shù)據(jù)技術(shù)原理與應(yīng)用》入門級大數(shù)據(jù)教材的基礎(chǔ)之上編寫的。為了確保教程質(zhì)量,在編著出版紙質(zhì)教材之前,實(shí)驗(yàn)室已經(jīng)于2016年10月通過實(shí)驗(yàn)室官網(wǎng)免費(fèi)發(fā)布共享了簡化版的Spark在線教程和相關(guān)教學(xué)資源,同時,該在線教程也已經(jīng)用于廈門大學(xué)計算機(jī)科學(xué)系研究生的大數(shù)據(jù)課程教學(xué),并成為全國高校大數(shù)據(jù)課程教師培訓(xùn)交流班的授課內(nèi)容。實(shí)驗(yàn)室根據(jù)讀者對在線Spark教程的大量反饋意見以及教學(xué)實(shí)踐中發(fā)現(xiàn)的問題,對Spark在線教程進(jìn)行了多次修正和完善,所有這些前期準(zhǔn)備工作,都為紙質(zhì)教材的編著出版打下了堅實(shí)的基礎(chǔ)。 披荊斬棘,在大數(shù)據(jù)叢林中開辟學(xué)習(xí)捷徑 填溝削坎,為快速學(xué)習(xí)Spark 技術(shù)鋪平道路 深入淺出,有效降低Spark 技術(shù)學(xué)習(xí)門檻 資源全面,構(gòu)建全方位一站式在線服務(wù)體系
Hadoop大數(shù)據(jù)開發(fā)實(shí)戰(zhàn)(慕課版) 電子書
本書共分11章,第1章對大數(shù)據(jù)及Hadoop進(jìn)行總體介紹;第2章講解了如何搭建Hadoop集群;第3-5章講解了HDFS分布式文件系統(tǒng)、MapReduce分布式計算框架以及Zookeeper分布式協(xié)調(diào)服務(wù);第6章講解Hadoop2.0的新特性;第7-10章主要講解了Hadoop生態(tài)圈中的相關(guān)輔助系統(tǒng),包括Hive、HBase分布式存儲系統(tǒng)、Flume、Saoop;第11章講解了綜合項(xiàng)目:電商精準(zhǔn)營
Hadoop大數(shù)據(jù)開發(fā)基礎(chǔ) 電子書
本書以任務(wù)為導(dǎo)向,較為全面地介紹了Hadoop大數(shù)據(jù)技術(shù)的相關(guān)知識。全書共6章,具體內(nèi)容包括Hadoop介紹、Hadoop集群的搭建及配置、Hadoop基礎(chǔ)操作、MapReduce編程入門、MapReduce進(jìn)階編程、項(xiàng)目案例:電影網(wǎng)站用戶性別預(yù)測。本書的第2~5章包含了實(shí)訓(xùn)與課后練習(xí),通過練習(xí)和操作實(shí)踐,幫助讀者鞏固所學(xué)的內(nèi)容。本書可以作為高校大數(shù)據(jù)技術(shù)類專業(yè)的教材,也可作為大數(shù)據(jù)技術(shù)愛好者的自
大數(shù)據(jù)處理技術(shù)基礎(chǔ)與應(yīng)用(Hadoop+Spark) 電子書
本書是一本介紹大數(shù)據(jù)處理技術(shù)的專業(yè)圖書,力求提高讀者對大數(shù)據(jù)處理的認(rèn)知水平和動手能力。本書首先介紹大數(shù)據(jù)技術(shù)的相關(guān)概念和發(fā)展歷程,從實(shí)踐的角度介紹Hadoop和Spark的安裝部署、編程基礎(chǔ)和使用方法;然后結(jié)合具體案例,重點(diǎn)介紹SparkRDD、SparkSQL、SparkStreaming、SparkGraphFrame等的應(yīng)用思路和方法,并通過具體代碼,讓讀者更好地感受大數(shù)據(jù)處理技術(shù)的效果。本

公眾號

關(guān)注微信公眾號