本書是一本研究漢語自然語言處理方面的基礎性、綜合性書籍,涉及NLP的語言理論、算法和工程實踐的方方面面,內容繁雜。
本書包括NLP的語言理論部分、算法部分、案例部分,涉及漢語的發展歷史、傳統的句法理論、認知語言學理論。需要指出的是,本書是迄今為止第一本系統介紹認知語言學和算法設計相結合的中文NLP書籍,並從認知語言學的視角重新認識和分析了NLP的句法和語義相結合的數據結構。這也是本書的創新之處。
本書適用於所有想學習NLP的技術人員,包括各大人工智能實驗室、軟件學院等專業機構。
鄭捷:www.threedweb.cn網站的負責人,研究方向是機器學習與自然語言處理。當前負責的核心產品是高精度自然語言認知系統的設計與研發,研發目標是高精度(識別率為85%~95%)的統一架構的NLP認知系統,已經出版專着《機器學習算法原理與編程實踐》,希望能與在NLP這方面有興趣的讀者一起學習交流。