亚洲系列一区中文字幕,亚洲成a人片在线不卡一二三区,亚洲av午夜福利精品一区人妖,亚洲中文字幕在线,亚洲精品无码mv在线观看

大模型動(dòng)力引擎:PyTorch性能與顯存優(yōu)化手冊(cè)

大模型動(dòng)力引擎:PyTorch性能與顯存優(yōu)化手冊(cè)

查閱電子書
手機(jī)掃碼
  • 微信掃一掃

    關(guān)注微信公眾號(hào)

因版權(quán)原因待上架

編輯推薦

助你理解、掌握PyTorch的優(yōu)化技巧。

內(nèi)容簡介

本書致力于探索如何在大規(guī)模深度學(xué)習(xí)模型訓(xùn)練中,最大限度地提高性能和優(yōu)化顯存使用。本書面向深度學(xué)習(xí)從業(yè)者,尤其是希望深入了解并提升模型訓(xùn)練效率的工程師與研究人員。隨著深度學(xué)習(xí)模型和數(shù)據(jù)規(guī)模的迅速增長,如何高效利用硬件資源,減少訓(xùn)練時(shí)間,成為當(dāng)前AI系統(tǒng)工程的關(guān)鍵挑戰(zhàn)。

本書內(nèi)容涵蓋從單機(jī)到分布式訓(xùn)練,從顯存管理到性能分析的多種優(yōu)化策略,力求通過豐富的代碼實(shí)例和深入的原理講解,使讀者能夠在實(shí)踐中靈活應(yīng)用這些方法。

作者簡介

作者張愛玲,本科畢業(yè)于清華大學(xué)電子工程系,后在美國伊利諾伊大學(xué)香檳分校獲得計(jì)算機(jī)科學(xué)碩士學(xué)位,是AI系統(tǒng)工程領(lǐng)域的資深技術(shù)專家。作為深度學(xué)習(xí)框架PyTorch核心團(tuán)隊(duì)成員,參與了多個(gè)關(guān)鍵組件的研發(fā)與優(yōu)化工作。

同時(shí),她作為技術(shù)負(fù)責(zé)人主導(dǎo)了PyTorch/XLA和Taichi編譯器等多個(gè)具有廣泛影響力的開源項(xiàng)目。目前在工業(yè)界專注于大規(guī)模語言模型訓(xùn)練的基礎(chǔ)設(shè)施開發(fā)與性能優(yōu)化工作。

章節(jié)目錄

版權(quán)信息

作者簡介

內(nèi)容簡介

前言

01 歡迎來到這場(chǎng)大模型競(jìng)賽

1.1 模型規(guī)模帶來的挑戰(zhàn)

1.2 數(shù)據(jù)規(guī)模帶來的挑戰(zhàn)

1.3 模型規(guī)模與數(shù)據(jù)增長的應(yīng)對(duì)方法

02 深度學(xué)習(xí)必備的硬件知識(shí)

2.1 CPU與內(nèi)存

2.2 硬盤

2.3 GPU

2.4 分布式系統(tǒng)

03 深知度識(shí)學(xué)習(xí)必備的PyTorch

3.1 PyTorch的張量數(shù)據(jù)結(jié)構(gòu)

3.2 PyTorch中的算子

3.3 PyTorch的動(dòng)態(tài)圖機(jī)制

3.4 PyTorch的自動(dòng)微分系統(tǒng)

3.5 PyTorch的異步執(zhí)行機(jī)制

04 定位性能瓶頸的工具和方法

4.1 配置性能分析所需的軟硬件環(huán)境

4.2 精確測(cè)量程序運(yùn)行時(shí)間

4.3 PyTorch性能分析器

4.4 GPU專業(yè)分析工具

4.5 CPU性能分析工具

4.6 本章小結(jié)

05 數(shù)據(jù)加載和預(yù)處理專題

5.1 數(shù)據(jù)接入的準(zhǔn)備階段

5.2 數(shù)據(jù)集的獲取和預(yù)處理

5.3 數(shù)據(jù)集的加載和使用

5.4 數(shù)據(jù)加載性能分析

5.5 本章小結(jié)

06 單卡性能優(yōu)化專題

6.1 提高數(shù)據(jù)任務(wù)的并行度

6.2 提高GPU計(jì)算任務(wù)的效率

6.3 減少CPU和GPU間的同步

6.4 降低程序中的額外開銷

6.5 有代價(jià)的性能優(yōu)化

6.6 本章小結(jié)

07 單卡顯存優(yōu)化專題

7.1 PyTorch的顯存管理機(jī)制

7.2 顯存的分析方法

7.3 訓(xùn)練過程中的顯存占用

7.4 通用顯存復(fù)用方法

7.5 有代價(jià)的顯存優(yōu)化技巧

7.6 優(yōu)化Python代碼以減少顯存占用

7.7 本章小結(jié)

08 分布式訓(xùn)練專題

8.1 分布式策略概述

8.2 集合通信原語

8.3 應(yīng)對(duì)數(shù)據(jù)增長的并行策略

8.4 應(yīng)對(duì)模型增長的并行策略

8.5 本章小結(jié)

09 高級(jí)優(yōu)化方法專題

9.1 自動(dòng)混合精度訓(xùn)練

9.2 自定義高性能算子

9.3 基于計(jì)算圖的性能優(yōu)化

9.4 本章小結(jié)

10 GPT-2優(yōu)化全流程

10.1 GPT模型結(jié)構(gòu)簡介

10.2 實(shí)驗(yàn)環(huán)境與機(jī)器配置

10.3 顯存優(yōu)化

10.4 性能優(yōu)化

結(jié)語

大模型動(dòng)力引擎:PyTorch性能與顯存優(yōu)化手冊(cè)是2024年由清華大學(xué)出版社出版,作者張愛玲。

溫馨提示:
得書感謝您對(duì)《大模型動(dòng)力引擎:PyTorch性能與顯存優(yōu)化手冊(cè)》關(guān)注和支持,如本書內(nèi)容有不良信息或侵權(quán)等情形的,請(qǐng)聯(lián)系本網(wǎng)站。

購買這本書

你可能喜歡
SEO搜索引擎優(yōu)化:技巧、策略與實(shí)戰(zhàn)案例 電子書
本書從基本的SEO理論進(jìn)行系統(tǒng)講解,配以豐富案例,對(duì)網(wǎng)站搭建SEO框架、每個(gè)頻道的SEO設(shè)置、每類網(wǎng)站的SEO技巧等方面進(jìn)行深入淺出的闡述。同時(shí),本書還通過部分篇幅系統(tǒng)地講述SEO團(tuán)隊(duì)管理、SEO項(xiàng)目管理機(jī)制、SEO軟件系統(tǒng)等相關(guān)知識(shí),對(duì)SEO工作具有全面的指導(dǎo)意義。本書注重理論和實(shí)戰(zhàn)經(jīng)驗(yàn)相結(jié)合,實(shí)用性強(qiáng),既有微觀操作指導(dǎo)性,又有宏觀決策意義,適合SEO專業(yè)人員、網(wǎng)站運(yùn)營人員、市場(chǎng)人員、管理人員、
SEO搜索引擎優(yōu)化  基礎(chǔ)+案例+實(shí)戰(zhàn) (慕課版) 電子書
本書分9章,包括SEO基礎(chǔ)入門、關(guān)鍵詞制定、網(wǎng)站SEO技術(shù)研究、SEO準(zhǔn)備工作、網(wǎng)站內(nèi)部布局及優(yōu)化、企業(yè)站SEO實(shí)戰(zhàn)、資訊類網(wǎng)站SEO實(shí)戰(zhàn)、移動(dòng)端SEO實(shí)戰(zhàn)以及SEO常見問題和解決方法。
吉利汽車維修技術(shù)手冊(cè)(動(dòng)力分冊(cè)) 電子書
本書內(nèi)容包括吉利車型所配用的1.0L到2.5L排量的發(fā)動(dòng)機(jī)(包括一款電控柴油發(fā)動(dòng)機(jī))的機(jī)械及電控部分的技術(shù)原理、拆裝流程、故障檢修等。
創(chuàng)業(yè)成長法則:驅(qū)動(dòng)公司成長的九大引擎 電子書
本書作者把創(chuàng)業(yè)以來關(guān)于公司成長的經(jīng)驗(yàn)和心得,系統(tǒng)地總結(jié)成創(chuàng)業(yè)成長的九大驅(qū)動(dòng)力:科技驅(qū)動(dòng)、創(chuàng)新驅(qū)動(dòng)、產(chǎn)品驅(qū)動(dòng)、商業(yè)模式驅(qū)動(dòng)、品牌驅(qū)動(dòng)、IP驅(qū)動(dòng)、運(yùn)營驅(qū)動(dòng)、融資驅(qū)動(dòng)和格局驅(qū)動(dòng),并輔以一手案例,解密多家明星創(chuàng)業(yè)公司快速成長的背后秘密。
SEO搜索引擎優(yōu)化:基礎(chǔ)、案例與實(shí)戰(zhàn)(第2版) 電子書
本書系統(tǒng)介紹了搜索引擎優(yōu)化(SEO)的方法。全書共分為11章,內(nèi)容包括SEO概述、搜索引擎概述、SEO的前期準(zhǔn)備工作、網(wǎng)站關(guān)鍵詞的優(yōu)化、網(wǎng)站結(jié)構(gòu)優(yōu)化、網(wǎng)站頁面優(yōu)化、網(wǎng)站內(nèi)容優(yōu)化等。

公眾號(hào)

關(guān)注微信公眾號(hào)