亚洲系列一区中文字幕,亚洲成a人片在线不卡一二三区,亚洲av午夜福利精品一区人妖,亚洲中文字幕在线,亚洲精品无码mv在线观看

實(shí)戰(zhàn)AI大模型

實(shí)戰(zhàn)AI大模型

查閱電子書
手機(jī)掃碼
  • 微信掃一掃

    關(guān)注微信公眾號(hào)

因版權(quán)原因待上架

編輯推薦

從基本概念到實(shí)踐技巧,全方位解讀AI大模型。

內(nèi)容簡(jiǎn)介

本書介紹了AI大模型的基礎(chǔ)知識(shí)和關(guān)鍵技術(shù),如Transformer、BERT、ALBERT、T5、GPT系列、InstructGPT、ChatGPT、GPT 4、PaLM和視覺(jué)模型等,并詳細(xì)解釋了這些模型的技術(shù)原理、實(shí)際應(yīng)用以及高性能計(jì)算(HPC)技術(shù)的使用,如并行計(jì)算和內(nèi)存優(yōu)化。

同時(shí),書中還提供了實(shí)踐案例,詳細(xì)介紹了如何使用Colossal AI訓(xùn)練各種模型。無(wú)論是人工智能初學(xué)者還是經(jīng)驗(yàn)豐富的實(shí)踐者,都能從本書學(xué)到實(shí)用的知識(shí)和技能,從而在迅速發(fā)展的AI領(lǐng)域中找到適合自己的方向。

作者簡(jiǎn)介

作者尤洋,清華大學(xué)碩士,加州伯克利大學(xué)博士,新加坡國(guó)立大學(xué)計(jì)算機(jī)系校長(zhǎng)青年教授。

章節(jié)目錄

版權(quán)信息

前言

第1章 深度學(xué)習(xí)中的AI大模型

1.1 AI大模型在人工智能領(lǐng)域的興起

1.1.1 AI大模型的發(fā)展與挑戰(zhàn)

1.1.2 AI大模型為何難以訓(xùn)練

1.2 深度學(xué)習(xí)框架入門

1.2.1 搭建神經(jīng)網(wǎng)絡(luò)

1.2.2 訓(xùn)練一個(gè)文本分類器

第2章 分布式系統(tǒng):AI大模型的誕生之所

2.1 深度學(xué)習(xí)與分布式系統(tǒng)

2.1.1 從分布式計(jì)算到分布式AI系統(tǒng)

2.1.2 大規(guī)模分布式訓(xùn)練平臺(tái)的關(guān)鍵技術(shù)

2.1.3 Colossal-AI應(yīng)用實(shí)踐

2.2 AI大模型訓(xùn)練方法

2.2.1 梯度累積和梯度裁剪

2.2.2 大批量?jī)?yōu)化器LARS/LAMB

2.2.3 模型精度與混合精度訓(xùn)練

2.3 異構(gòu)訓(xùn)練

2.3.1 異構(gòu)訓(xùn)練的基本原理

2.3.2 異構(gòu)訓(xùn)練的實(shí)現(xiàn)策略

2.4 實(shí)戰(zhàn)分布式訓(xùn)練

2.4.1 Colossal-AI環(huán)境搭建

2.4.2 使用Colossal-AI訓(xùn)練第一個(gè)模型

2.4.3 AI大模型的異構(gòu)訓(xùn)練

第3章 分布式訓(xùn)練:上千臺(tái)機(jī)器如何共同起舞

3.1 并行策略基礎(chǔ)原理

3.1.1 數(shù)據(jù)并行:最基本的并行訓(xùn)練范式

3.1.2 張量并行:層內(nèi)模型并行

3.1.3 流水線并行的原理與實(shí)現(xiàn)

3.2 高級(jí)并行策略基礎(chǔ)原理

3.2.1 序列并行:超長(zhǎng)序列模型訓(xùn)練

3.2.2 混合并行:擴(kuò)展模型到千億參數(shù)

3.2.3 自動(dòng)并行:自動(dòng)化的分布式并行訓(xùn)練

3.3 實(shí)戰(zhàn)分布式訓(xùn)練

3.3.1 應(yīng)用模型并行策略的實(shí)際案例

3.3.2 結(jié)合多種并行策略的訓(xùn)練實(shí)踐

第4章 AI大模型時(shí)代的奠基石 Transformer模型

4.1 自然語(yǔ)言處理基礎(chǔ)

4.1.1 自然語(yǔ)言任務(wù)介紹

4.1.2 語(yǔ)言輸入的預(yù)處理

4.1.3 序列到序列模型

4.2 Transformer詳解

4.2.1 Transformer模型結(jié)構(gòu)

4.2.2 注意力與自注意力機(jī)制

4.2.3 Transformer中的歸一化

4.3 Transformer的變體與擴(kuò)展

4.3.1 變體模型匯總

4.3.2 Transformer序列位置信息的編碼處理

4.3.3 Transformer訓(xùn)練

第5章 AI大幅度提升Google搜索質(zhì)量:BERT模型

5.1 BERT模型詳解

5.1.1 BERT模型總體架構(gòu)與輸入形式

5.1.2 BERT模型預(yù)訓(xùn)練任務(wù)

5.1.3 BERT模型的應(yīng)用方法

5.2 高效降低內(nèi)存使用的ALBERT模型

5.2.1 基于參數(shù)共享的參數(shù)縮減方法

5.2.2 句子順序預(yù)測(cè)(SOP)預(yù)訓(xùn)練任務(wù)

5.3 BERT模型實(shí)戰(zhàn)訓(xùn)練

5.3.1 構(gòu)建BERT模型

5.3.2 并行訓(xùn)練BERT模型

第6章 統(tǒng)一自然語(yǔ)言處理范式的T5模型

6.1 T5模型詳解

6.1.1 T5模型架構(gòu)和輸入輸出——文本到文本

6.1.2 T5模型預(yù)訓(xùn)練

6.1.3 T5模型應(yīng)用前景及未來(lái)發(fā)展

6.2 統(tǒng)一BERT和GPT的BART模型

6.2.1 從BERT、GPT到BART

6.2.2 BART模型預(yù)訓(xùn)練

6.2.3 BART模型的應(yīng)用

6.3 統(tǒng)一語(yǔ)言學(xué)習(xí)范式的UL2框架

6.3.1 關(guān)于語(yǔ)言模型預(yù)訓(xùn)練的統(tǒng)一視角

6.3.2 結(jié)合不同預(yù)訓(xùn)練范式的混合去噪器

6.3.3 UL2的模型性能

6.4 T5模型預(yù)訓(xùn)練方法和關(guān)鍵技術(shù)

第7章 作為通用人工智能起點(diǎn)的GPT系列模型

7.1 GPT系列模型的起源

7.1.1 GPT的訓(xùn)練方法和關(guān)鍵技術(shù)

7.1.2 GPT的模型性能評(píng)估分析

7.2 GPT-2模型詳解

7.2.1 GPT-2的核心思想

7.2.2 GPT-2的模型性能

7.3 GPT-3模型詳解

7.3.1 小樣本學(xué)習(xí)、一次學(xué)習(xí)與零次學(xué)習(xí)的異同

7.3.2 GPT-3的訓(xùn)練方法和關(guān)鍵技術(shù)

7.3.3 GPT-3的模型性能與效果評(píng)估

7.4 GPT-3模型構(gòu)建與訓(xùn)練實(shí)戰(zhàn)

7.4.1 構(gòu)建GPT-3模型

7.4.2 使用異構(gòu)訓(xùn)練降低GPT-3訓(xùn)練消耗資源

第8章 興起新一代人工智能浪潮:ChatGPT模型

8.1 能與互聯(lián)網(wǎng)交互的WebGPT

8.1.1 WebGPT的訓(xùn)練方法和關(guān)鍵技術(shù)

8.1.2 WebGPT的模型性能評(píng)估分析

8.2 能與人類交互的InstructGPT模型

8.2.1 指令學(xué)習(xí)

8.2.2 近端策略優(yōu)化

8.2.3 基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)方法匯總

8.3 ChatGPT和GPT-4

8.3.1 ChatGPT模型簡(jiǎn)介和應(yīng)用

8.3.2 GPT-4模型特點(diǎn)與應(yīng)用

8.4 構(gòu)建會(huì)話系統(tǒng)模型

8.4.1 基于監(jiān)督的指令精調(diào)與模型訓(xùn)練

8.4.2 會(huì)話系統(tǒng)的推理與部署策略

第9章 百花齊放的自然語(yǔ)言模型:Switch Transfomer和PaLM

9.1 萬(wàn)億參數(shù)稀疏大模型Switch Transformer

9.1.1 稀疏門控混合專家模型MoE

9.1.2 基于MoE的萬(wàn)億參數(shù)模型Switch Transformer

9.2 PaLM模型:優(yōu)化語(yǔ)言模型性能

9.2.1 PaLM模型的結(jié)構(gòu)、原理和關(guān)鍵特點(diǎn)

9.2.2 PaLM訓(xùn)練策略與效果評(píng)估

9.3 PaLM實(shí)戰(zhàn)訓(xùn)練

第10章 實(shí)現(xiàn)Transformer向計(jì)算機(jī)視覺(jué)進(jìn)軍的ViT模型

10.1 Transformer在計(jì)算機(jī)視覺(jué)中的應(yīng)用

10.1.1 ViT模型在計(jì)算機(jī)視覺(jué)中的發(fā)展背景

10.1.2 ViT模型的架構(gòu)、原理和關(guān)鍵要素

10.1.3 大規(guī)模ViT模型的應(yīng)用場(chǎng)景和挑戰(zhàn)

10.2 視覺(jué)大模型的進(jìn)一步發(fā)展:Transformer與卷積的融合

10.2.1 基于Transformer的視覺(jué)模型的改進(jìn)應(yīng)用

10.2.2 基于卷積的視覺(jué)模型的發(fā)展優(yōu)化

10.3 ViT模型構(gòu)建與訓(xùn)練實(shí)戰(zhàn)

10.3.1 構(gòu)建ViT模型的關(guān)鍵步驟與關(guān)鍵方法

10.3.2 多維張量并行的ViT的實(shí)戰(zhàn)演練

參考文獻(xiàn)

實(shí)戰(zhàn)AI大模型是2023年由機(jī)械工業(yè)出版社出版,作者尤洋。

溫馨提示:
得書感謝您對(duì)《實(shí)戰(zhàn)AI大模型》關(guān)注和支持,如本書內(nèi)容有不良信息或侵權(quán)等情形的,請(qǐng)聯(lián)系本網(wǎng)站。

購(gòu)買這本書

你可能喜歡
AI大模型安全觀:通用人工智能的應(yīng)用場(chǎng)景、安全挑戰(zhàn)與未來(lái)影響 電子書
深度掃描大模型應(yīng)用場(chǎng)景中看得見與看不見的風(fēng)險(xiǎn)。
大前研一解讀AI與Fintech 電子書
大前研一和業(yè)界的精英們講述AI與FinTech的*新情況,向讀者分享抓住商機(jī)的方法。從始于18世紀(jì)60年代的工業(yè)革命和20世紀(jì)60年代的信息技術(shù)革命中可以看出,新技術(shù)的誕生徹底改變了人們迄今為止的生活方式和商業(yè)模式。而現(xiàn)在正掀起了由AI和FinTech掀起的革命,給世界帶來(lái)了巨大的沖擊。通過(guò)本書不僅可以了解日本在AI和FinTech方面的現(xiàn)實(shí)情況,也可以思考今后中國(guó)應(yīng)該在AI與FinTech方面如
崗位管理與崗位勝任力模型構(gòu)建實(shí)戰(zhàn) 電子書
本書主要介紹崗位管理和崗位勝任力模型在人力資源管理實(shí)戰(zhàn)中的應(yīng)用方法。
AI設(shè)計(jì)時(shí)代:Midjourney實(shí)戰(zhàn)應(yīng)用手冊(cè) 電子書
這是一本講解使用人工智能工具輔助進(jìn)行設(shè)計(jì)的專業(yè)教程,旨在幫助設(shè)計(jì)師掌握并運(yùn)用Midjourney提高設(shè)計(jì)效率和創(chuàng)新能力。書中詳細(xì)介紹了Midjourney在品牌設(shè)計(jì)、平面設(shè)計(jì)、包裝設(shè)計(jì)、電商設(shè)計(jì)和界面設(shè)計(jì)等領(lǐng)域的應(yīng)用方法,并通過(guò)豐富的案例展示了運(yùn)用Midjourney出圖輔助進(jìn)行設(shè)計(jì)的全流程。本書附贈(zèng)實(shí)戰(zhàn)案例的素材圖、設(shè)計(jì)源文件和樣機(jī)文件,以便讀者能夠邊學(xué)邊練、加深理解。本書適合品牌設(shè)計(jì)師、平面設(shè)

公眾號(hào)

關(guān)注微信公眾號(hào)