潘朵拉 -FindBook 找書網

圖書名稱：AI獨家解密－DALL·E、Midjourney、Stable Diffusion Python打開圖片生成原理潘朵拉盒子

AI獨家解密－DALL•E、Midjourney、Stable Diffusion Python打開圖片生成原理潘朵拉盒子

✴︎AIGC 核心概念：快速掌握 AI 生成內容的關鍵技術。
✴︎影像生成技術：解密 GAN、擴散模型、VAE 的運作原理。
✴︎Stable Diffusion：深入解析 VAE、CLIP、交叉注意力等技術。
✴︎頂尖 AI 模型：比較 DALL•E 2、Imagen、DeepFloyd 的特色。
✴︎熱門工具剖析：Midjourney、SDXL、DALL•E 3 詳細解讀。
✴︎多模態 AI：探索 AI 如何融合文本、影像與聲音。
✴︎影像變形技術：解讀 unCLIP、Stable Diffusion 的影像加工能力。
✴︎完整實作指南：手把手帶你訓練 Stable Diffusion。
✴︎低成本 AI 訓練：用 LoRA 技術輕鬆微調 AI 模型。
✴︎開源生態與應用：進入 AI 創作與技術社群。
✴︎產業應用解析：AIGC 在藝術、廣告、遊戲等領域的發展。
✴︎適合所有讀者：AI 新手、創作者、技術專家都適用。

作者簡介：

南柯
某頭部網際網路公司AIGC團隊技術負責人，高級演算法專家，極客時間「AI 繪畫核心技術與實戰」專欄作者，擁有十多年電腦視覺領域從業經驗，帶領團隊推動多模態生成，尤其是AI圖像生成與編輯、多模態大語言模型、數字人等熱點方向的技術建設。在ICCV和AAAI年會等AI領域頂級會議上發表過多篇論文，擁有100多項專利。

作者序

隨著人工智慧（Artificial Intelligence，AI）技術的高速發展，我們正在見證一場技術的革新，它正以前所未有的速度和規模重塑著我們的世界。在這場技術革新中，已經出現了很多具有代表性的人工智慧生成內容（Artificial Intelligence Generated Content，AIGC）產品，如ChatGPT 和Midjourney，它們不僅展示了AI 的強大能力，更開啟了人類與AI 協作創作的新紀元。

以本書要討論的AI 影像生成模型為例，無論是專業的藝術家還是業餘藝術同好，都可以利用Midjourney、DALL•E 等工具，透過簡單的提示語（Prompt，即文字描述）創作出精美的影像，將使用者的想像轉為具體的視覺呈現，極大地拓寬了創作的空間。與以往相比，我們不必深入學習繪畫技巧或花費大量時間學習影像處理軟體的使用方法，就能輕鬆創作出具有特定風格的藝術作品。

關於AI 影像生成模型，人們經常追問的問題可以總結為以下3 個。

• 為什麼Stable Diffusion 等AI 影像生成模型一出現，生成對抗網路（Generative Adversarial Network，GAN）就黯然失色了？

• Midjourney 憑藉AI 影像生成取得了巨大成功，它可能採用了哪些獨特的演算法方案？

• 我能否訓練一個自己專屬的AI 影像生成模型，隨心所欲地生成富有創意的內容？

本書將和讀者一同揭開這些問題的答案，探索AI 影像生成技術的奧秘。

本書旨在介紹AI 影像生成模型的核心技術和實踐技巧，既適合AI 影像生成領域的從業者，尤其是軟體開發人員、產品經理閱讀，也適合對AI 影像生成感興趣的科學研究人員和電腦相關專業的學生閱讀。

本書將從深度學習的基礎知識開始講解，探討影像生成技術從GAN 到擴散模型的技術演化，分析Stable Diffusion 模型背後的演算法原理，解讀DALL•E 系列、Midjourney 系列、SDXL 等模型背後的技術方案，並展望AI影像生成模型未來的發展趨勢。本書包含大量範例程式和使用AI 影像生成模型生成的插圖，將幫助讀者在感受AI 影像生成模型的強大功能的同時，深入理解影像生成技術的理論基礎，並能夠將所學知識應用於實際的AI 影像生成專案。

最後，我要對所有支援本書的人表示深深的感謝，特別要感謝人民郵電出版社的編輯和極客時間平臺的工作人員。他們的專業指導、資源支援和不懈努力對本書的完成有著至關重要的作用。我還要感謝選擇本書的讀者，希望你們能夠學有所得。

願我們的AI 影像生成之旅充滿啟發和創造力！

南柯

顯示全部內容

第 1 章 AIGC 基礎
1.1 身邊的AIGC
1.1.1 影像生成和編輯類工具
1.1.2 文字提效類工具
1.1.3 音訊創作類工具
1.2 神經網路
1.2.1 類神經元
1.2.2 啟動函數
1.2.3 類神經網路
1.2.4 損失函數
1.2.5 最佳化器
1.2.6 卷積神經網路
1.3 多模態模型
1.3.1 認識模態
1.3.2 典型多模態模型
1.3.3 參數量
1.3.4 計算量
1.4 小結
第 2 章影像生成模型：GAN 和擴散模型
2.1 影像生成模型的技術演化
2.1.1 第一代影像生成模型：VAE
2.1.2 第二代影像生成模型：GAN
2.1.3 第三代影像生成模型：基於流的模型
2.1.4 第四代影像生...

顯示全部內容