本論文集是「第三屆數位典藏與數位人文國際研討會」的論文結集,共收錄九篇文章,可粗略分為兩大類,代表著現階段數位人文領域發展的兩種類型。
一類是文字的分析。如〈多重脈絡—數位檔案之問題與挑戰〉旨在說明數位系統對脈絡探勘所能帶來的協助,同時結合了文字處理和圖像呈現,試圖討論數位人文所能開啟的全新研究視野。〈自然語言處理技術於中文史學文獻分析之初步應用〉企圖結合自然語言的資訊技術和傳統史學文獻分析,試圖析理出結合的可能。〈以文本分析呈現臺灣海外史料政治思想輪廓〉則用數位技術,綜觀而量化的去分析過往政治思想史所研究的場域。〈結合漢典古籍虛詞常見字與統計量化分析進行漢譯佛典譯者風格辨別〉一文從大量的佛教經典的字句整理中,去回答譯者風格。〈「共現」詞頻分析及其運用—以「華人」觀念起源為例〉賦與詞頻分析新的詮釋,並以「華人」這個觀念做具體的實驗。〈漢語方言語音資料庫自動擴增補完方法〉則是希望能應用數位科技,去處理語言學中十分困難的方言問題。
數位人文研究的第二類關懷則是在呈現上,如何用新技術去展現過往文字所不能負載的成果。例如空間一向是人文研究所看重,卻又最常被忽略的部分,透過GIS 技術,學界開始填補這個斷層。〈京都大比例尺地圖(京都市明細圖Kyoto-shi meisai-zu)數位化〉、〈數位典藏應用的社會效益與永續經營—以阪神大地震資料3D視覺化為例〉、〈「太平洋史前Lapita陶器線上數位資料庫」的建立與運用〉,三篇文章的關注點各不相同,各是針對底圖、3D視覺化或具體應用等等不同面向開發,其共同處便是將空間帶回人文學的關懷之中,提供嶄新的從地理資訊出發的思考角度。
誠如〈導論──數位人文的變與不變〉所言,數位和人文兩者之間的對話,應當是一個沒有止境、不斷持續的過程。在數位人文發展的研究方式和型態裡,不斷的對話與交流是最為重要的關鍵;藉由跨越不同國界、不同研究議題、不同技術領域,得以彰顯數位人文作為研究方法的價值和意義。
作者簡介:
項潔(臺大資工系特聘教授及台大數位人文研究中心主任)、金觀濤(政大講座教授)、劉青峰(香港中文大學中國文化研究所名譽研究員)、劉昭麟 (政大資科系教授)、劉吉軒(政大資科系教授兼圖書館館長)、洪振洲(法鼓佛教學院圖書資訊館館長)、馬德偉(美國天普大學助理教授)、蔡宗翰(元智大學資工系副教授)、赤石直美(日本京都立命館大學地理系博士後研究員)、福島幸弘(日本京都府立綜合資料館研究員)、矢野桂司 (日本京都立命館大學地理系教授)、稻葉光行(日本京都立命館大學日本藝術與文化數位人文中心教授)、佐藤達哉(日本京都立命館大學法律心理中心教授)、邱斯嘉(中研院人社中心副研究員),以及翁稷安、邱偉雲、姚育松、柯雲娥、張惠真、譚修雯、黃瑞期、甯格致、謝承恩、林居正、王昱鈞、瀬戸壽一、滑田明暢、若林宏輔、中妻拓也、破田野智己、齋藤進也、郭潔、蘇郁尹。
章節試閱
書摘一
多重脈絡——數位檔案之問題與挑戰項潔、翁稷安檔案本身自然不會說話,必須要透過史家的詮釋才有可能彰顯其意義,紙本的檔案處理並不是完全沒有問題的,尤其是單一脈絡的編輯方式,很容易造成誤導和盲點。理論上,通過學者的勤勞與用心,在檔案間細細爬梳,仍然可以躲過編輯者的分類大刀,重新組合出自己的需求,但終究只是理論上而已,面對汗牛充棟的史料處理,對運氣的需要很可能勝過努力,更遑論過程中的費時費力。數位化後檔案的新脈絡不但不是要否定檔案和史家之間的既有關連,更是要加拉近兩者的距離。檔案經過數位化處理後,不但能保存原有的收藏邏輯,更能賦與其不受篇幅和印刷限制的靈活和彈性;史家仍是史料最終的闡釋和解讀者,但通過資訊的處理,除了創造出一個令研究者更能夠觀察的環境,並析理出埋沒在史料中的新線索,使史家可以將心力投注在對史料的解讀。或許,當史料獲得和整理的問題被資訊技術解決之後,不再是困擾研究者的重擔,如何發展出鞭辟入裡的新論述,可能才是數位化時代的檔案脈絡所給予研究者的真正挑戰。總之,經由檔案的數位化,傳統檔案單一脈絡的限制被打破,檔案整理與檔案研究之間的矛盾亦隨之減輕,關鍵便在於建立一套以研究為主要思考取向的檔案檢索系統,透過檔案檢索系統的設計,檔案的豐富且多重的脈絡可被發現、被呈現、被觀察。
書摘二
太平洋史前Lapita陶器線上數位資料庫的建立與運用邱斯嘉、郭潔、蘇郁尹以往無法統整資料的弊病現在藉由文字與影像的雙重呈現方式得以解決,日後可以開始著手重新檢視原有的Lapita文化分區標準,也能夠更為細緻地處理各文化分區本身的陶器傳統演變史,尋找出各分區之間的互動過程 (邱斯嘉, 2011)。而Lapita陶器傳統與密克羅尼西亞以及島嶼東南亞之間的關聯到底有多密切(Hung et al., 2011),也可以經由大範圍的搜尋而取得可信度更高的證據。往後再搭配上相關遺址其他出土的器物種類與密集度,便能進一步討論不同紋飾的分布狀況是否與遺址本身的生業經濟能力強弱、與其他遺址之間的往來交通便利性、或是其他社會因素有關 (Bedford & Sand, 2007:5; 邱斯嘉, 郭潔, & 蘇郁尹, 2011)。 透過利用資料庫所提供的器形與紋飾結合搜尋功能,未來也可以開始著手進行研究在同一時間內不同島嶼出現的不同類型陶器是否會施加相類似紋飾,或是配合陶器在遺址出土脈絡資訊,來討論不同功用的陶器是否會呈現出不一樣的紋飾與器形特徵。這些特徵,也可以進一步透過陶器的岩象與化學成分分析結果來探究陶器的流傳或交換模式。這些資訊都能夠促進研究者對於Lapita文化叢本身的理解,以及其與周遭不同地區間的互動過程 (Chiu, 2011:56-58; 邱斯嘉, 2011:142)。
書摘一
多重脈絡——數位檔案之問題與挑戰項潔、翁稷安檔案本身自然不會說話,必須要透過史家的詮釋才有可能彰顯其意義,紙本的檔案處理並不是完全沒有問題的,尤其是單一脈絡的編輯方式,很容易造成誤導和盲點。理論上,通過學者的勤勞與用心,在檔案間細細爬梳,仍然可以躲過編輯者的分類大刀,重新組合出自己的需求,但終究只是理論上而已,面對汗牛充棟的史料處理,對運氣的需要很可能勝過努力,更遑論過程中的費時費力。數位化後檔案的新脈絡不但不是要否定檔案和史家之間的既有關連,更是要加拉近兩者的距離。檔案經過數位化處理後...
作者序
文 / 項潔
從全球各國數位典藏發展的歷史來看,臺灣開始的不算太早,但也不算晚。暫且不論個別學校、單位或個人的研究和努力,從國科會在1998年以「數位博物館計畫」開始投入國家資源,有系統地發展數位典藏來算,到現在也已將近15年了。在這段不算短的時間裡,我國投入了大量經費,也將大量的文化資產數位化,其中最重要,從2002年開始執行的「數位典藏國家型計畫」,更產生了指標性的作用,讓「數位典藏」在臺灣成為一個大眾語言內的詞彙。
數位典藏國家型計畫的成功,至少有一部分歸功於許多資深且傑出的研究人員,尤其是人文學者,不計報酬地全心投入。但是從大約2005年開始,我們漸漸發覺這些優秀的學者在他們本身的研究中,似乎並沒有充分利用他們花了大量精力數位化的檔案;這令我感到困惑,因為這樣不是事倍功半嗎?為什麼不能將數位化工作和本身的研究結合在一起呢?觀察到這個現象後,我開始去探討它的環節。我發現其中的一個重要原因是數位典藏系統的設計往往沒有考慮到使用者── 尤其是研究者── 的需求,以致於一直到現在絕大多數的研究者還是認為檢索系統只能幫他們找資料罷了,而不能幫忙整理或分析資料。這是很可惜的,因為許多資訊技術已經十分成熟,如果能夠與數位檔案結合並有效地運用在這些系統中,應對人文研究產生非常大的助益。在更進一步的探討後,我發現這個問題並不是臺灣獨有的,在國外亦有學者思考這個問題,而且已有一個研究社群,那便是「數位人文」。
用最簡單的話來講,「數位人文」就是結合大量數位材料,運用資訊科技,來從事人文研究。顧名思義,這是一項跨領域整合的工作。要達到這個目標,除了要有大量高品質的數位資源可供使用外,更需要人文學者與資訊學者密切的互動與合作。有鑑於此,國立臺灣大學數位典藏研究發展中心從2009年開始舉辦每年一度的「數位典藏與數位人文國際研討會」,希望藉由這個會議,不但能夠介紹世界最新的研究成果,並能提供國內外人文與資訊學者交流的機會,讓臺灣的數位人文研究能夠遍地開花,並與國際接軌。
《數位人文研究叢書》即是這個年度會議產出的一項成品。叢書中的每一篇文章均在研討會中發表過,再經修改及至少兩位審查人的審查通過。在此特別感謝臺大數典中心的蔡炯民博士、陳怡君小姐與全體同仁對本叢書投注的心力。我們希望透過這個系列的叢書,提升國內學界對數位人文的認知,並激發進一步的研究。
項潔 2011年9月於臺大
文 / 項潔
從全球各國數位典藏發展的歷史來看,臺灣開始的不算太早,但也不算晚。暫且不論個別學校、單位或個人的研究和努力,從國科會在1998年以「數位博物館計畫」開始投入國家資源,有系統地發展數位典藏來算,到現在也已將近15年了。在這段不算短的時間裡,我國投入了大量經費,也將大量的文化資產數位化,其中最重要,從2002年開始執行的「數位典藏國家型計畫」,更產生了指標性的作用,讓「數位典藏」在臺灣成為一個大眾語言內的詞彙。
數位典藏國家型計畫的成功,至少有一部分歸功於許多資深且傑出的研究人員,尤其是人文學者,...
目錄
009 導論
數位人文的變與不變 Introduction:
The Change and Unchange of Digital Humanities
*項潔、翁稷安
Part Ⅰ檔案史料
Archives & Documents
025 多重脈絡--數位檔案之問題與挑戰
Mutiple-contextualization: Problems and Challenges on Digital Archives
*項潔、翁稷安
061 自然語言處理技術於中文史學文獻分析之初步應用
An Exploration of Analyzing Historical Chinese Documents with Natural Language Processing
Techniques
*劉昭麟、金觀濤、劉青峰、邱偉雲、姚育松
083 以文本分析呈現臺灣海外史料政治思想輪廓
Text Analysis on Overseas Taiwanese Journals for Political Thought Profiling
*劉吉軒、柯雲娥、張惠真、譚修雯、黃瑞期、甯格致
Part Ⅱ語料庫語言學
Corpus Linguistics
117 結合漢典古籍虛詞常見字與統計量化分析進行漢譯佛典譯者風格辨別
Authorship Attribution of Early Chinese Buddish Translations: Using Principal Component Analysis
with Commonly Used Ancient Chinese Empty Words
*謝承恩、洪振洲、馬德偉
141 「共現」詞頻分析及其運用--以「華人」觀念起源為例
Frequency Analysis and Application of “Co-occurrence” Phrases: The Origin of the Concept
“Ha-ren”as an Example
*金觀濤、邱偉雲、劉昭麟
171 漢語方言與音資料庫自動擴增補完方法
An Automatic Augmentation Method for Chinese Dialect Pronunciation Databases
*林居正、王昱鈞、蔡宗翰
Part Ⅲ 地理資訊
Geograghical Information
191 Digitalization and Utilization of the “Large-scale Maps of Kyoto City(Kyoto-shi meisai-zu)”
京都大比例尺地圖(京都市明細圖Kyoto-shi meisai-zu)數位化
*Naomi Akaishi、Toshikazu Seto、Yukihiro Fukushimav、Keiji Yano
213 Towards Social Application and Sustainability of Digital Archives: The Case Study of 3D Visualization
of Large-scale Documens of the Great Hanshin-Awaji Earthquake
數位典藏應用的社會效益與永續經營--以阪神大地震資料3D視覺化為例
231 「太平洋史前Lapita陶器線上數位資料庫」的建立與運用
Establishment and Research Applications of the Online Database for the Study of Lapita Pottery
*邱斯嘉、郭潔、蘇郁尹
009 導論
數位人文的變與不變 Introduction:
The Change and Unchange of Digital Humanities
*項潔、翁稷安
Part Ⅰ檔案史料
Archives & Documents
025 多重脈絡--數位檔案之問題與挑戰
Mutiple-contextualization: Problems and Challenges on Digital Archives
*項潔、翁稷安
061 自然語言處理技術於中文史學文獻分析之初步應用
An Exploration of Analyzing Historical Chinese Documents with Natural Language...