序
在當今的互聯世界中,圖和網路無處不在。在複雜網路模型中,異質網路(異質圖)將現實世界的系統建模為大量多模態和多類型物件之間的交互。由於異質網路對複雜網路固有結構的顯式建模有助於進行強大、深入的網路分析,因此異質網路顯得尤為重要。近年來,表示學習(嵌入學習)通過各種深度學習或嵌入方法來用低維分佈表示高維資料,獲得迅速發展,已成為高維資料分析的有力工具。與此同時,圖表示學習(網路嵌入)在低維空間中學習節點/邊的表示,也已經證明了它在各種圖挖掘和圖分析任務中的有效性。
本書是第一本專注於異質圖表示學習的書。異質圖表示學習是指在低維空間中學習異質圖中的節點/邊表示,同時為下游任務(例如,節點/圖分類和連結預測)保留異質結構和語義,近年來已成為一種功能強大、逼真且通用的網路建模工具,並越來越受到學術界和工業界的關注。
本書對異質圖表示學習及其應用進行了全面而廣泛的介紹,包括對該領域代表性工作的研究。本書不僅廣泛介紹了主流的技術和模型,包括結構保持、屬性輔助技術和動態圖技術,而且介紹了其在推薦、文本挖掘和工業領域的廣泛應用。此外,本書還提供了異質圖表示學習的平臺以及實踐。作為該領域的第一本書,本書總結了異質圖表示學習的最新發展,並介紹了該領域的前沿研究。總體而言,本書具有以下兩個特點:1)為研究人員闡述該領域的基本問題,以及現階段該領域的研究熱點;2)展示關於異質圖在真實系統建模和學習交互系統結構特徵上的最新應用研究。
本書作者在異質圖表示學習和相關領域有大量研究經驗。PhilipS.Yu是資料採擷和異質資訊網路領域的權威專家之一。石川是Philip在異質資訊網路研究領域的長期合作者,他系統地研究了基於異質圖的推薦和表示學習,將異質資訊網路建模應用於電子商務和文本挖掘領域,近年來在異質圖表示學習領域做了大量領先的工作。王嘯是網路嵌入研究領域的一位新星學者。本書系統地總結了他們在異質圖表示學習方面的貢獻,不僅可以作為學術界和工業界的指南,也可以作為本科生和研究生的教科書。希望大家可以享受本書愉快的閱讀之旅。
韓家煒(Jiawei Han)
Michael Aiken 講席教授
伊利諾伊大學厄巴納–香檳分校
前言
異質圖是在真實世界中普遍存在的包含不同類型的節點和邊的圖。從書目網路和社交網路到推薦系統資料,裡面都存在著異質圖。異質圖表示學習是指在低維空間中學習節點/邊表示,同時為下游任務(例如,節點/圖的分類和連結預測)保留異質結構和語義,目前這個方向吸引了相當多的關注,我們已經見證了異質圖表示學習方法在各種實際應用(如推薦系統)上的驚人表現。越來越多的關於異質圖表示學習的工作出現,也預示著這個方向是學術界和工業界的一個全球性研究趨勢。因此,全面總結和討論異質圖表示學習方法可謂迫在眉睫。
相比於同質圖表示學習,異質圖中的異質性使異質圖表示學習存在著特有的挑戰。例如,異質圖中存在著多種類型的邊,這使得它存在更複雜的結構,而且節點屬性也是異質的。同時,異質圖表示學習與現實世界的應用高度相關,從異質圖構建到學習,可能需要更多的領域知識。以上這些因素都會嚴重影響異質圖表示學習的性能,因此需要仔細考慮。總之,對異質圖表示學習的研究具有重要的科學和應用價值。
本書面向的是對異質圖感興趣的讀者,總體來說,本書是為那些希望瞭解異質圖表示學習的基本問題、技術和應用的讀者準備的。具體來說,我們希望相關領域的學生、研究人員和工程師都能從本書中得到啟發。
本書分為四個部分,第一部分簡要介紹整個領域,第二、三部分深入研究相關技術和應用,第四部分介紹一個異質圖神經網路演算法平臺,並探索未來方向。
在第一部分中,我們首先從不同方面概述最近的異質圖表示學習方法,同時總結一些公開資料,可以為這一領域的未來研究和應用提供便利。這一部分將幫助讀者迅速瞭解這個領域的整體發展。具體來說,在第1章,我們將介紹基本概念和定義,以及同質和異質圖表示學習的背景,第2章介紹方法分類和公開資料。
在第二部分中,我們將對有代表性的異質圖表示學習技術進行深入而詳細的介紹。這一部分將幫助讀者瞭解這個領域的基本問題,並闡明如何為這些問題設計最優的異質圖表示學習方法。在第3章中,我們將討論結構保持的異質圖表示學習方法,包括元路徑結構和網路模式結構。第4章介紹帶屬性的異質圖表示學習方法,集中介紹異質圖神經網路。之後,我們將在第5章中介紹動態異質圖表示學習方法,這些方法考慮了增量學習、時序資訊和時序交互。在第6章中,我們將討論異質圖表示學習的一些新興話題,包括對抗學習、重要性採樣和雙曲空間表示學習。
在第三部分中,我們將總結異質圖表示學習在現實中的應用。讀者在這一部分可以瞭解異質圖表示學習的成功應用,以及將先進的技術應用于現實場景的方法。在第7章中,我們會展示異質圖表示學習是如何改進不同推薦系統的,例如Top-N推薦、冷開機推薦和作者集識別。第8章介紹文本挖掘的應用,重點是短文本分類和新聞推薦場景。在第9章中,我們將介紹異質圖表示學習在工業界的應用,例如套現用戶檢測、意向推薦、分享推薦和好友增強推薦。
在第四部分中,我們將介紹一個異質圖表示學習的計算平臺,並對本書進行總結。考慮到深度學習平臺的重要性,在第10章中,我們將介紹圖機器學習的基礎平臺,特別是我們研發的異質圖神經網路演算法開源平臺OpenHGNN。同時,我們以三個代表性的異質圖神經網路為例,展示如何使用該平臺。最後,我們在第11章討論未來的研究方向和尚未解決的問題。
在本書的撰寫過程中,除作者外,還有其他一些人也做出了很大的貢獻,我們向所有為撰寫本書做出貢獻的人表示衷心的感謝。這些人包括薄德瑜、劉佳瑋、王睿嘉、吉余崗、紀厚業、張依丁、張夢玫、楊天持、范少華、王春辰、韓輝、崔琪、張琦、劉念、莊遠鑫、王貞儀、楚貫一、劉洪瑞、李晨、趙天宇、翟新龍、夏東林、梁峰綺。我們也要感謝PhilipS.Yu教授的許多學生的精心校對,他們是曹雨微、竇英通、範子煒、黃鶴、李霄寒、劉志偉、夏聰穎。此外,本書得到了國家重點基礎研究發展計畫(2013CB329606)和國家自然科學基金(No.U20B2045,U1936220,61772082,61702296,62002029,62172052)的支持,還得到了美國國家科學基金會III-1763325、III-1909323、III-2106758和SaTC-1930941贈款的部分支援。我們也一併表示感謝。最後,感謝我們的家人在本書寫作過程中給予我們的全心全意的支持。