作者-肖桐 -FindBook 找書網

圖書名稱：Google翻譯實作：機器翻譯NLP基礎及模型親手打造

★☆★☆★【全中文自然語言處理】★☆★☆★

有了多拉A夢翻譯年糕誰還要找翻譯社？人人都可以當口譯哥！
旅遊網紅用手機環遊世界溝通無礙！
當Google翻譯像空氣一樣自然的存在時，我們仿佛忘了機器翻譯走了幾百年，篳路藍縷有多麼的艱辛。身為使用者在享受這些科技的成果時，技術人員則更好奇些神奇應用底層的科學是如何發展出來的。熟悉史丹佛CS224n NLP課程的人，一定對大師Chris Manning對機器翻譯的重點十分讚嘆。本書就是堪比大師NLP和機器翻譯的真正鉅作。從機器翻譯的歷史、數學原理、理論細節、實作理論、參考資源、最新發展、從最細節到最宏觀的高度都放入書中。NLP是AI上皇冠上的一個明珠，機器翻譯更是最能展現NLP技術的極緻精華。從事NLP的技術人員、資料科學家、神經網路演算法科學家，如果想要真正進入NLP的世界，本書將會是20年來最重要，最完整、最能精進技術的一個重要提升。

本書特色
◎機器翻譯簡介
說明了從理性主義一直進入到資料主義的過程。接下來說明統計語言建模的基礎，進一步進入詞法語法分析的原理，其中並穿插了翻譯品質的評鑑標準。

◎統計機器翻譯
介紹了以詞、扭曲度、繁衍度、短語、句法為基礎的機器翻譯原理及實作。

◎近代機器翻譯的新世代 – 神經機器翻譯
介紹了神經網路及神經語言的建模、循環神經網路模型、卷積神經網路模型及自注意力機制的模型。

◎神經翻譯系統的細節
包括模型訓練及最佳化，模型的推論，更有針對神經網路系統的結構精進，以及使用低資源的神經網路(如資料蒸餾)，以及多模態、多層次的機器翻譯，也介紹了新一代神經網路的應用及發展。

本書技術重點
✪理性主義及資料主義
✪統計語言建議
✪詞法/語法分析，以機率圖/分類器模型
✪科學方法評估翻譯品質
✪以詞、扭曲度/繁衍度、短語、句法模型的翻譯方法
✪Google大殺器：神經機器翻譯建模
✪循環神經網路模型/注意力機制，卷積神經網路模型
✪Transformer，自注意力機制
✪神經網路翻譯模型訓練/推論/結構最佳化
✪小型裝置上的神經網路機器翻譯
✪多模態/多層次機器翻譯
✪當代機器翻譯的應用及佈署

作者簡介：

肖桐
博士，東北大學教授、博士生導師，東北大學計算機學院人工智能係系主任，
東北大學自然語言處理實驗室主任，小牛翻譯（NiuTrans）聯合創始人。
於東北大學計算機專業獲得博士學位。
2006-2009年赴日本富士施樂、微軟亞洲研究院訪問學習，
並於2013一2014年赴英國劍橋大學開展博士後研究。
主要研究領域包括自然語言處理、機器學習等。
在國內外相關領域高水平會議及期刊上發表學術論文70餘篇。
作為項目技術負責人，成功研發了NiuTrans、NiuTensor等開源系統，
在WMT、CCMT/CWMT、NTCIR等國內外評測中多次獲得冠軍。
2014年獲得中國中文信息學會首屆優秀博士論文提名獎，
2016年獲得中國中文信息學會“錢偉長中文信息處理科學技術獎”一等獎。
任ACL、EMNLP、TACL等國際著名會議及期刊的領域主席和常駐審稿人。

朱靖波
博士，東北大學教授、博士生導師，小牛翻譯創始人。於東北大學計算機專業獲得博士學位，曾在香港城市大學（2004-2005年）和美國南加州大學ISI（2006-2007 年）開展訪問研究。從1992年開始，專注於語言分析和機器翻譯技術研究工作，在國內外高水平會議及期刊上發表學術論文200餘篇，2005年入選國家教育部新世紀優秀人才計劃，2016年獲得中國中文資訊學會"錢偉長中文資訊處理科學技術獎"一等獎。

作者序

前言

緣起

讓電腦進行自然語言的翻譯是人類長久以來的夢想，也是人工智慧的重要目標之一。自20世紀90年代起，機器翻譯邁入了以統計建模為基礎的時代，發展到今天，已經大量應用了深度學習等機器學習方法，並獲得了令人矚目的進步。在這個時代背景下，對機器翻譯的模型、方法和實現技術進行深入了解，是自然語言處理領域的研究者和實踐者所渴望的。

與所有從事機器翻譯研究的人一樣，筆者也夢想著有朝一日，機器翻譯能夠完全實現。這個想法可以追溯到1973年，姚天順教授和王寶庫教授領銜創立了東北大學自然語言處理實驗室，把機器...

顯示全部內容

第1部分機器翻譯基礎
01 機器翻譯簡介
1.1 機器翻譯的概念
1.2 機器翻譯簡史
1.3 機器翻譯現狀及挑戰
1.4 基於規則的機器翻譯方法
1.5 資料驅動的機器翻譯方法
1.6 推薦學習資源
02 統計語言建模基礎
2.1 機率論基礎
2.2 擲骰子遊戲
2.3 n-gram 語言模型
2.4 預測與搜索
2.5 小結及拓展閱讀
03 詞法分析和語法分析基礎
3.1 問題概述
3.2 中文分詞
3.3 命名實體辨識
3.4 句法分析
3.5 小結及拓展閱讀
04 翻譯品質評價
4.1 譯文品質評價面臨的挑戰
4.2 人工評價
4.3 有參考答案的自動評價
4.4 無參考答案的自動評價...

顯示全部內容