演講內容提要:
中國古代常可見以「間」或「半間」計數建築,近透過資料庫的檢索,察知《續修四庫全書》本的陸增祥編《八瓊室金石補正》,收錄西安碑林藏金明昌五年 (1194) 《京兆府提學所帖碑》釋文,而此法律碑刻上所載的近200處地舍學產首次出現0.75間的零頭。在瀏覽並對照學術圈早期流傳的一種該叢書的PDF檔後,赫然發現約13,500字的釋文圖檔中竟有119個字與紙本原書不同。經抽查該《續修四庫全書》其它PDF檔中的6卷,亦皆出現誤字,判斷此均應是軟件壓縮加上人為竄改所致!本文即以該碑作為「e文獻學」(指e時代必須交叉處理傳統及數字文本的文獻學)的範式案例。
先前的文史工作者在以關鍵詞檢索資料庫時,多逕自認定各庫輸入的文字等同於原本,然翻查「典海」「雕龍」「鼎秀」及「書同文」所錄入的此碑,卻發現各有76-344個誤字。此外,對照中國政法大學所藏的善拓,亦可見陸增祥的釋文仍有不少錯漏失當之處。也就是說,e文獻學在此個案中得面對石刻、拓片、釋文之稿本與刻本、PDF檔、資料庫等不同文本,及其識讀或轉換過程所產生的訛誤。本研究即因對這些文本進行了深入辨正,得以首度理解碑中「間」與「㭬」等術語的用法與關係。此文或因緣際會成為「e文獻學」個案研究的濫觴,更提醒學界有必要反思對大數據的過度仰賴,且應較平衡地去掌握其滋生的機遇與侷限。