학술지 검색
Download PDF Export Citation Korean Bibliography PMC Previewer
ISSN : 2982-4737(Print)
ISSN : 2982-4745(Online)
Journal of Applied Studies on Sinograph and Literary Sinitic Vol.2 No.1 pp.131-158
DOI : https://doi.org/10.36523/HERC.2023.2.131

探索數位人文在明清歷史研究中的應用

; ;

Abstract

在這場演講中,我們將深入探討「成化犁庭事件」,一個複雜且重要的歷史事件,涉及明 朝、建州女真、朝鮮三方的交錯關係。首先,我們會介紹這個事件的背景。此外,我將展示 我們團隊在軍事段落分類AI、地名辨識、地圖視覺化及文本對讀等技術上的創新成果。這些 技術不僅提升了對史料《明實錄》與《朝鮮王朝實錄》的比對效率,也提高了準確率和速 度,從而深化了我們對歷史事件的理解。我們將使用視覺化地圖、表格和圖表來直觀展示這 些技術在歷史研究中的應用,使聽眾能更加清晰地理解這些複雜的歷史交織。最後,我們將 總結演講的重點和成果,並展望這些技術在未來歷史研究中的更廣泛應用。這不僅包括對其 他歷史事件的探索,還包括與政治學與外交學等其他領域的結合,從而為歷史研究開闢更廣 闊的視野。


明淸史 연구에서 디지털인문학 응용 방안 탐색
‘成化犁庭’을 중심으로

황위전*, 류위신**, 자오뤄위***, 셰신이****, 차이쭝한*****
*석사과정, 中央研究院人社中心地理資訊專題中心, 國立台灣大學歷史系
**석사과정, 中央研究院人社中心地理資訊專題中心, 國立中央大學資訊工程系
***석사과정, 中央研究院人社中心地理資訊專題中心, 國立中央大學資訊工程系
****석사과정, 中央研究院人社中心地理資訊專題中心, 國立中央大學資訊工程系
*****교신저자, 연구원, 中央研究院人社中心地理資訊專題中心, 國立中央大學資訊工程系 / E-mail: thtsai@g.ncu.edu.tw

초록


본 발표에서는 「成化犁庭」을 심층적으로 고찰해 보고자 한다. 「成化犁庭」는 중요한 역사적 사건으로 세 국가, 明, 建州女眞, 朝鮮 사이의 복잡하게 얽혀있는 관계를 다룬다. 본 발표에서는 먼저 「成化犁庭」의 역사적 배경을 설명하고, 군사 단락 분류 AI, 지명 인식, 지도 시각화, 텍스트 대조 등 기술 분야에서 본 연구팀이 가진 앞선 연구 성과를 소개할 것이다. 이러한 기술은 『明實錄』과 『朝鮮王朝實錄』 대조 작업의 효율성을 향상시킬 뿐 아니라 작업의 정확도와 속도를 높여 해당 역사적 사건을 심도 깊게 파악할 수 있게 돕는다. 또한, 이러한 기술이 역사 연구에 어떻게 적용되는지 시각화된 지도, 표 및 도표를 사용하여 직관적으로 보여주고자 한다. 이를 통해 복잡하게 얽혀있는 역사적 사건을 더욱 명확하게 이해할 수 있도록 할 것이다. 마지막으로 본고의 내용과 성과를 요약하고 이러한 기술이 앞으로의 역사 연구 영역에서 어떻게 폭넓게 활용될 수 있는지 그 전망을 제시해 보고자 한다. 본 연구는 역사 연구 영역에서뿐만 아니라 정치학, 외교학 등 다른 영역에도 폭넓게 적용되므로 앞으로의 역사 연구에 더 넓은 시야를 제공할 수 있을 것이다.



    Ⅰ. 導論

    本研究致力於探索如何透過數位技術改善傳統歷史研究方法中的限制。在歷史研究過程中, 學者常需閱讀大量文獻,尤其在面對龐大的數位文本時,常見的挑戰包括資料格式限制和搜尋 不便,這些因素常導致研究效率低下並增加謬誤的風險。例如,當使用《明實錄》這樣的線上 資料庫時,僅能依賴關鍵字搜尋來尋找特定主題的資料,這經常導致搜尋結果與研究者的期望 不符。

    為了克服這些挑戰,我們採用了人工智慧技術,特別是在沒有事先標記的資料下,自動識別 史料中的軍事相關段落。此外,我們還開發了視覺化瀏覽工具和跨文本對讀工具,以加速整理和 收集與研究現象相關的一致訊息。本研究以成化犁庭事件為例,展示我們團隊在軍事段落分 類AI、地名辨識、地圖視覺化及文本對讀等方面的創新成果。這些技術不僅提高了對《明實錄》 和《朝鮮王朝實錄》資料的比對效率和準確性,也從不同角度深化了對該歷史事件的理解。

    透過視覺化地圖、表格和圖表的應用,我們將直觀展示這些技術在歷史研究中的實際應用, 讓聽眾能更清楚地理解這些複雜歷史交織的情節。最終,本研究旨在提供一種新的研究途徑, 不僅提高研究效率,也為歷史研究開闢更廣闊的視野

    Ⅱ. 研究方法

    在我們的研究中,選擇明憲宗時期的成化犁庭事件為討論對象,在傳統的研究方法之 下,成化犁庭的研究者須閱覽卷帙浩繁的《明實錄》與《朝鮮王朝實錄》,從中找出事件相關 的段落,如此將會耗費許多時間,甚至造成效率不彰;此外,目前以傳統方法做出的研究多為 梳理事件始末,缺乏多元的研究面向。本研究首先利用AI技術辨識《明實錄》中的軍事段落, 進一步辨識出每個段落指涉的地理位置後,基於GIS圖台製作視覺化瀏覽工具(軍事熱區圖), 接著加入《朝鮮王朝實錄》建立對讀模型,而後利用模型抓取《明實錄》與《朝鮮王朝實錄》 中關於成化犁庭事件的相似段落進行對讀分析,從不同視角探討在對女真事務上明與朝鮮的關 係。我們希望能藉由新技術探討成化犁庭,期許能提供研究者不同於以往的研究思路以及更有 效率的研究方法。

    1. 史料:《明實錄》與《朝鮮王朝實錄》

    本研究選用《明實錄》作為主要文獻進行分析,並以《朝鮮王朝實錄》作為對讀史料。《明 實錄》乃是結合紀傳體、紀事本末體、典章制度體的編年體史書。《明實錄》以每一位帝王為 中心紀錄明代史實,內容囊括了皇親國戚的活動、內閣六部的政事、省州府縣的工作、周邊民 族的朝貢、外國的遣使等事項。《明實錄》中與軍事相關的紀錄,包括詔令、奏書、咨文、軍 事行動等,為研究明代軍事史提供了絕佳的材料。《朝鮮王朝實錄》為李氏朝鮮的編年體史書, 以中文書寫,內容涉及王朝的政治、軍事、經濟、社會、文化等各面向,具有很高的可信度,是 研究朝鮮歷史的重要史料。此外,《朝鮮王朝實錄》保留了大量外國與外族的資料,尤其對女真 族的記載十分詳細,比《明實錄》或其他中國史書的記載還完整,因此適合作為本研究探討成化 犁庭的材料。

    2. 擷取明實錄軍事相關的段落

    1) 資料預處理

    資料預處理階段涉及多個步驟,借鑒了兩個自然語言處理任務的結果:命名實體識別(NER) 和命名實體消歧(NED)。 前者遵循了(Tsai 等人, 2017)所概述的方法,專注於識別和分類文 本中的實體,後者則是基於(Tsai 等人,2020)的工作,解決了辨識實體時的歧義。這些任務 是在台灣中央研究院歷史語言研究所提供的數位化《明實錄》資料庫上完成的,預處理過程中 的挑戰包括處理古代漢語的不一致性和龐大的實體數量。 然而,透過利用先進的自然語言處理 技術,這些問題得到了解決。 因此,我們整理了136,427個段落,其中包含人物實體,這將成為 我們分析的基礎。

    2) 整體框架

    此框架的整體結構如 图 1 所示。這個過程始於選擇一小組種子詞(seed word)。這些種 子詞是代表性術語,捕捉我們旨在分類的類別的本質。隨後,我們利用一種被稱為弱監督資料 標註機制的方法,使用這些種子詞對與軍事相關的文本進行註釋。 這種方法有效地產生了有 效的標記資料,減少了人為介入,產生的標記資料重新組織形成一個結構良好的訓練資料集,用 於訓練監督分類模型。最後,訓練好的模型被用來識別整個資料集中與軍事相關的文本。

    3) 弱標記資料的生成

    我們弱監督資料標註器的基礎是LOTClass模型(Meng等人,2020)。 他們提出了LOTClass作 為一種弱監督文本分類模型,不需要任何標記的文本,只需要每個類別的標籤名稱,表現出與強 半監督和監督模型相當的性能。利用基於BERT的LOTClass模型,我們使用種子詞來標註研究中 的數據,這些種子詞是捕捉類別本質的代表性術語。除了以基本的軍事行動詞如攻擊防 禦來表示軍事文件,我們也選擇了20個不同類別的種子詞來代表非軍事文件(參見 表 1),這 些類別是根據(Tsai 等人,2017)的事件類型衍生出來的,並且對每個事件類型的文本進行了仔 細分析,並選擇了常見詞作為該事件類型的種子詞,確保不同類別之間的種子詞沒有重疊。

    為了訓練目的,我們使用了來自軍事類別的4,000份文件和來自非軍事類別的4,000份文件。 為了評估弱監督資料標註器的效能,我們手動檢視了訓練集中隨機抽取的5%樣本。 發現弱標 記資料產生器的準確度約為87.3%。 值得注意的是,該模型能夠識別文件的類別,而無需依賴 明顯的關鍵字,從而克服了關鍵字搜尋方法的局限性。 這可以在 表 2 的範例1、5和6中看出, 在這些文本中並沒有包含任何使用者提供的種子詞或類別指示性詞彙

    4) 基於BERT的監督文本分類

    我們採用了基於BERT的中文模型作為我們監督文本分類模型的基礎。該模型旨在進行二元 分類任務,具體是區分資料集中的軍事和非軍事文件。 為了對BERT-base-Chinese模型進行微 調,使用了80%的標記資料進行訓練,剩餘的20%用於驗證(見 表 3),此模型在訓練集上達 到了89%的準確率,在驗證集上達到了90%的準確率(見 表 4)。 一旦模型經過微調和評估, 我們就部署了經過訓練的二元分類器來對資料集中剩餘的128,427份文件進行分類。

    這些準確率值值得注意,進一步的分析有助於將這些結果置於更廣泛的脈絡中。將這些數字 與其他類似模型或方法的表現進行比較,並討論這些結果對目前研究的影響,這是很重要的。 同時,需要注意方法可能存在的任何潛在限制或問題。 例如,對模型基於種子詞進行準確分類 的能力是否存在疑慮? 這些問題可能如何影響研究的結果?

    5) 軍事段落範例

    5 的文本敘述有外族入侵,以及總兵官楊信被任命調兵應援的情況。文本中同樣沒有最 初 軍事事件給的seed words,但模型仍準確地學習出文本中屬於軍事的特徵。

    在 表 6 中呈現的另一個軍事文本案例中,模型同樣成功地將埋伏等詞彙準確分類為軍 事相關特徵。這一發現突顯出,使用弱標記數據生成器(weakly labeled data generator)所標記 的資料,相對於傳統的關鍵字搜尋方法,展現了更高的效率和準確性。這種生成器透過利用上 下文嵌入(contextualized embeddings)技術,能夠更有效地識別和提取文本中的核心特徵。

    2. 視覺化技術

    為了視覺化明實錄軍事文本中的地點,我們遵循 图 2 中的步驟:

    1) 地名實體提取

    運用半監督深度神經框架辨識數字化的MSL語料庫中的軍事記錄,該框架執行了命名實體識 別(NER)(Tsai 等人,2017)。我們的可視化方法同樣可使用其他文本分類器來提取所需類 別的文本。

    2) 地名實體提取

    對於執行了命名實體識別的語料庫,我們可以有效運用正則表達式(RegEx)來提取文本中 提及的所有地點。在未處理的語料庫中,我們使用生成式人工智慧來提取隱含的地點名稱。

    3) 搜索詞擴展

    透過CCTS API擴展搜索詞以查找地點信息,以提高檢索到的地點座標的準確性。由於NER 標記的地點名稱可能不是地圖上的實際地點,我們使用搜索詞擴展算法來解決這個問題。具體 而言,我們通過步驟(a) 和(b)(參見 图 3) 生成搜索詞。

    4) 查找出現在《明實錄》中地名的座標。

    我們使用CCTS API1)查找位置對應的座標。對於提取出的每個位置,我們基於在步驟2中生 成的搜索詞進行查詢。

    5) 使用 Python Plotly 繪製軍事紀錄熱區圖。

    我們使用上述處理過的數據繪製軍事紀錄的密度熱度圖。對於同一段落中重複提及的相同地 名,我們只計算一次。為了觀察年份的變化,我們從文本標題中提取西元年份和中國年號。此 外,我們可以為使用者提供三種繪製模式,如圖1所示。

    3. 對讀技術(釋義識別 Paraphrase Identification)

    在這項研究中,我們應用了 SPITAC (Chu, 2022),它可以提取描述同一事件的兩個段落。 在 SPITAC中,該模型在《後漢書》、《三國志》等中國古代文獻上進行了訓練、評估和測試,獲 得了88.6的F1分數。 因此,我們的目標是利用預先訓練的釋義辨識模型(SPITAC)來提取 MSL 和 JSDSL 中記錄的有關成化犁庭事件的描述。 然而,由於兩筆記錄中的資料量很大,因此對所 有資料進行釋義辨識是不切實際的。 因此,針對1460年、1464年、1465年、1466年、1467年事 件相關區域週邊事件熱圖顯示的高密度結果,我們將對這些特定年份的記錄進行釋義識別。

    如 图 4 所示,釋義識別 ( Paraphrase Identification ) 的架構從資料預處理開始。 在此階段, 我們以年為單位,對每一年的 MSL 和 JSDSL 內容來進行對齊。 此後,考慮到深度學習模型輸 入資料的長度限制,我們採用(Pang等人,2021)的句子層級雜訊過濾方法來減少文字長度。 隨後,使用釋義識別模型來偵測包含釋義的段落。

    此外,熱區圖顯示 1460 年、1464 年、1465 年、1466 年和 1467 年在事件相關區域內顯示 出高密度結果。 這意味著最初需要識別 1457 年至 1467 年 11,318,138 筆資料的工作,已減少 到僅識別上述五個重要年份的 4,990,361 筆資料。 這種技術(熱區圖)有助於減少資料量,從 而降低計算成本。 此後,我們的釋義識別模型提取了 47,119 對識別為釋義的內容,進一步減 少了與手動判斷相關的時間和成本(表 8)。

    Ⅲ. 結果分析

    1. 對讀技術

    過去關於成化犁庭的研究中,學者大多聚焦在建州女真與明朝廷、建州女真與朝鮮的關係, 鮮少討論明朝廷與朝鮮之間的互動,然而朝鮮與建州女真比鄰,一方面需謹守藩屬國的本分, 配合明朝廷對女真的政策,甚至必要時出兵援助,另一方面也有自己的政治考量,對明朝廷難 免會有陽奉陰違之舉,兩者之間複雜的從屬關係確實值得一探究竟。

    藉由對讀技術,我們得以從《明實錄》與《朝鮮王朝實錄》共計數千萬筆的資料中,抓取雙 方相關的段落,從而對比明朝廷與朝鮮對同一事件的論述,或是將事件的前因後果串聯起來, 如此除了對整起事件有更全面的了解,也能避免片面地解讀史料。我們從模型抓取的段落中, 提取出與成化犁庭相關者,作為梳理明與朝鮮關係的論證材料,後文表格中的兩個段落便是對 讀模型判斷相關者,以下論述之。

    1) 朝鮮試圖合理化其與建州女真秘密互動的企圖

    自正統十四年以來,以董山為首的建州等衛女真乘間竊掠邊境,遼東為之困敝,可謂成 化犁庭事件的遠因,而明朝廷對建州女真採取的策略為寬猛相濟德威並舉,懷柔招撫 的同時又適時地進行武力打擊;朝鮮方面,雖然朝鮮與建州女真也曾屢次發生衝突,但世祖李瑈 即位後以懷柔為主,其知曉以蠻夷(朝鮮)攻蠻夷(建州女真),中國之勢,為了不陷於中 國之術,同時也希望向北擴張勢力,因而極力招徠建州女真,意圖將女真納入朝鮮的管轄之下。

    然而明朝自然不能容忍朝鮮與建州女真私下往來,因此天順三年二月22日,明英宗下詔斥責 朝鮮國王給予建州三衛都督賞賜,命其改過自省,恪守禮法(見表 9 左半部);而藉由對讀技 術抓取的對應段落,我們可以知道朝鮮與建州女真私下往來之所以會被朝廷得知,是因為建州 都指揮李兀哈與童火爾赤將此事告訴遼東總兵官(見表 9 右半部)。

    四月8日世祖受敕,對於英宗的斥責,世祖的回應為此輩人面獸心,若不許來,卽生邊釁, 不得已而待之,明使節陳嘉猷除了表示理解,也指出朝廷在意的乃是董山、李滿住二人曾受 朝廷都督職事,殿下又加授職,於理未安,因此陳嘉猷指示世祖應當在奏書中載明與女真往來 和授職的紀錄,朝廷也好究責於女真。此段落同樣被對讀所抓取,限於篇幅此處不列出原文。

    四月16日世祖遣吏曹參判曺錫文、仁順府尹權摯至大明上奏,世祖先列舉出宣德至正統年間 朝廷給朝鮮的敕諭,內容皆是囑咐朝鮮應對建州女真善加撫卹,而後列舉自其先祖康獻王到其 父莊憲王曾授與建州女真的官職,接著列出董山等人來回朝鮮的日期。而後如表 10 右半部所 示,世祖以朝鮮比鄰女真與島倭、擔心無法負荷兩邊的侵擾為由解釋交好女真的行為,並再次 強調此乃遵循朝廷輯和隣境,棄其前過的敕諭。從世祖的回應可以看到,他將朝廷的敕諭 作為交好女真的依據,表明其只是遵循朝廷的旨意,並將授與女真官職這件事上溯到前幾任君 主,表明該行為其來有自,他只是遵循傳統而行事。有趣的是,雖然陳嘉猷要求世祖在奏書中 寫明曾授與女真的官職,但事實上世祖在奏書中並沒有提到自己曾授與女真的官職,僅提到父 祖,不知是否有避重就輕的意味。

    世祖並沒有在奏書中承認與女真的私下來往是錯誤的,授與官職一事也輕輕帶過,因此英宗 並不滿意世祖的答覆,進而有了四月29日的第二封詔書(見表 10 左半部)。

    該封詔書的重點便是在於私授官職,英宗斥責世祖沒有認清自己的過錯,朝廷僅敕令朝鮮與 女真保持和平,並沒有允許其來往,且董山等人已被朝廷賜予官職,朝鮮又再授予,是與朝廷 抗衡矣,而世祖將授官上溯至前朝而不改過,則是不能蓋前人之愆。根據王臻的研究,明 朝廷授與董山等人的官職是實質性的地方長官稱號,朝鮮授予的則往往是虛銜,儘管如此明朝廷 還是擔心朝鮮與女真會聯合起來對中國造成威脅,因此對此十分忌諱(Wang,2005)。

    此外,值得一提的是,藉由對讀模型的抓取,我們可以發現同樣一封詔書,在《明實錄》與 《朝鮮王朝實錄》的內容有些微的不同(見表 11),在《朝鮮王朝實錄》中多出了王欲和隣保 境,理固宜,然而除官給賞事,實未當,王之明達,豈不自知?然《春秋》責備賢者,況 朕以至誠御天下,豈可外王而不言?兩句,由於缺少這兩句話並未影響內容大意,因此推測是 將詔書發往朝鮮之前有經過修飾,然而這足以顯示對讀技術在發掘史料異同上是具有便利性的。

    朝鮮受敕之後,世祖確實禁絕了女真的朝覲,例如同年五月李滿住之子李豆里來朝覲,也只 是由節制使給鹽糧之後送還,不過雙方的關係尚且良好,董山等人與朝鮮官員仍有往來,間接 成為世祖的消息來源。

    2) 世祖的謹慎和進攻女真的企圖

    然而從明憲宗成化二年(1466)起女真開始頻繁進犯遼東,五月虜寇累入開原境搶掠人 畜,九月分掠開原、撫順、瀋陽、遼陽等處,成化三年(1467)二月海西建州等虜入鴉鶻 關抄掠佛僧洞,三月建州海西女直入連山關通遠堡開原撫順搶掠,四月紏合毛憐等處 夷人侵犯邊境,虜掠人畜,王臻認為這是因為憲宗即位後,董山想緩和與明的關係而主動覲 見,並請求進秩,但憲宗僅賜與絲帛綢緞,這使得董山十分不滿,認為憲宗輕視自己,因此女 真才有一連串寇邊行動(Wang,2005)。

    這使明朝廷對女真的態度逐漸傾向以武力征伐,尤其成化三年七月董山因不思改過、舉止囂 張而被拘留在廣寧時,竟持小刀傷害通事,此事讓憲宗決議發兵征討。至於朝鮮方面,雖然女 真的攻勢主要是針對遼東,但朝鮮擔憂將會受到更多的波及,世祖十三年(1467),世祖便曾言 中國不靖,則我國亦不得寧矣。苟不預慮,安能應猝?,因此諭臣下故毋恃其不來,恃 吾有以待之。此正務農積穀,休養精鍊,日不暇給之時。中朝雙方對女真的方針並不衝突, 因而促成之後的聯合軍事行動。

    如表 12 所示,成化三年五月25日訂下由監督軍務太監黃順、提督軍務左都御史李秉、總兵 官趙輔等人率兵征剿女真,將於九月發兵;同年八月五日,朝鮮收到遼東傳來的咨文,聲明要對 建州女真搗其巢穴,絕其種類,並要求朝鮮國王截斷女真的後路,擒捕逃到邊境的殘兵。

    與成化三年五月25日對讀的另一則史料,為同年八月27日世祖與臣下商議出兵事宜,可以看 到世祖的態度十分謹慎(表 13右半部)。由於遼東傳來的僅是咨文而非聖旨,因此世祖對咨文 抱有疑慮,擔心若之後咨文與聖旨不同會被降罪,甚至有交通邊將之嫌,因此暫不回咨;而若 遼東都司問起為何不回咨,則擬答覆因聖旨未到,但已在境上嚴兵以待。事實上像這般由國王 親自擬定如何與明朝使節應對,在世祖在位期間不止一次。世祖在出兵一事上的謹慎應對,可 能與先前和女真往來而受到朝廷斥責有關,即不願再被扣上和朝廷抗衡的罪名。

    九月十四日,遼東百戶白顒將要求朝鮮出兵的敕書與咨文一同送到,世祖與白顒商定九月二 十七日攻建州;然而,隔天又以建州西至婆猪江路遠,貴兵二十七日入攻,則官兵恐未及 到為由,改成二十八、二十九日入攻。箇中原因,應為不希望朝鮮軍先於明軍入攻而搶占功 勞與戰果,世祖也明白背後的意涵,因此囑咐臣下不可必欲與中國爭先成功卿等寧爲 緩幾,愼勿爲後日之藉口(見表 14 右半部),此處又可看到世祖對中國事務的謹慎態度。

    雙方最後於九月二十九日入攻,從戰後雙方的奏報可以看到各自的行軍路線(見表 15), 明軍右哨九月二十九日攻入宋產八、李欵赤、馬木冬、李古納等寨,九月三十日至十月七日四 散搜捕,最後在摩天嶺、松子林等處遇賊,由副總兵都指揮同知裴顯率領的另一支軍隊於九月 二十九日攻入耿冬火你、赤王馬、伐苦如等寨(二月二十九日應改為九月二十九日),從十月 一日起連日分頭搜捕,攻入張赤升哈黑松林山等處;朝鮮軍於九月二十九日時攻入潑豬江李滿 住等所住的寨,九月三十日攻入兀彌府諸寨,十月四日回還。此處也顯示對讀技術之另一效 用,即藉由日期比對雙方行軍路線,應用於成化犁庭此等跨國戰役是很有利的。

    第一次成化犁庭事件在十日內便大獲全勝,然而透過與《明實錄》十月30日對讀的另一則史 料(見表 16 右半部),我們可以看到世祖希望能趁建州女真受創之時再次發兵,將其徹底殲 滅,成就威播天下之勢,但被中樞府知事康純以地勢險要、冰雪覆路、糧食不足、補給不 便等四不可勸諫而作罷。不過,世祖一改此前謹慎的作風,在沒有朝廷允許的情況下欲再 度發兵建州,推測世祖利用明朝廷以夷制夷的心態,縱使朝鮮殲滅建州女真,朝廷至多也 只會下詔令其改過,如同天順四年(1460)攻打毛憐衛一般,畢竟朝廷最擔心的是朝鮮與女真聯 合起來而非他們互相削弱;但另一方面,建州女真作為最靠近朝鮮的部族,對朝鮮的壓制作用 最大,朝廷究竟會不會容許朝鮮不經過同意就將建州女真殲滅,也是值得思考。

    另外值得一提的是,世祖十三年十月21日世祖遣行副護軍高台弼到大鳴奏報戰役經過,並移 交戰果與被擄漢人給遼東都司,而成化四年(1468)正月7日《明實錄》記載此事,嘉獎世祖協助 明軍之功,並賞賜金銀布匹。不過,朝鮮呈報的戰果是斬首二百八十六級、獲牛馬共二十七 頭、殺牛馬二百二十九頭,《明實錄》的紀錄則是斬首三百八十六級、獲牛馬等畜二百 餘(見表 17),不知其中的差異純粹是傳鈔錯誤,還是朝廷有意識地美化戰果。不管如何, 這個例子也再次佐證對讀技術可發現同一事件在不同文本中的差異。

    3) 成宗的謹慎與進攻女真的企圖

    戰役之後建州女真元氣大傷,但依然有殘餘勢力騷擾邊境,例如成化四年三月建州虜糾合 朵顏三衛,寇遼東開原等處邊境。除了進犯遼東,李滿住後裔為了報仇也進犯朝鮮,例如成 化六年(1470)建州衛都指揮兀者禿木等、成化十一年(1475)朝鮮國王上奏建州野人紏聚毛憐等 衞夷人,侵擾本國邊境不已,對此憲宗還出面下詔令建州頭目悔過睦鄰,自相合好。然 而女真並沒有停止寇邊,成化十三年(1477)十月又侵擾遼東清河、靉陽二堡,一番恩威並施 後,朝廷最後終於決定再次進行大規模的征剿,並於成化十五年(1479)十月十四日下詔要求朝 鮮成宗出兵夾擊(見表 18 左半部)。

    然而,朝鮮受敕之後,出兵與否卻在朝臣間引起爭論(見表 18 右半部),朝臣間不贊同出 兵者多於贊同出兵者,不贊同的原因包括平安道農事困難、西北早雪導致無蒭茭餵馬,以及此 次女真必然會對朝鮮有所防備,對朝鮮軍危害甚大;贊成的原因則是難以違抗朝廷命令,雖然 贊成派也知道情勢不利,但為了避免與大國交惡只好不得已而為之。成宗最後也認為不好推 辭,因此同意出兵,但最後只出兵一萬,比成化三年少了一倍,可見即使到了成宗朝仍然對大 國謹慎以對,但也不會一味地討好,還是有自己的考量。

    與《明實錄》成化十五年十月14日對讀的另一則史料,則是成宗與臣下擬定與明朝使節的應 答(見表 19)。由於情勢對朝鮮不利,朝鮮須為自己多做考量,因此這次擬定的回答為己方留 下了更多空間,例如明使節若問起出兵之事,便提起天候不佳、擔心難以行軍,若問軍隊人 數,則以倉促難辦為由含糊帶過,若對方非要具體人數,也只回答萬餘人,若敕書指明某日攻 某處,則以山勢險危、雪深草枯為由不一定能當日抵達,但一定會督促將帥盡快前往云云,不 欲透露太多資訊,也不欲許下任何保證。

    關於第二次成化犁庭的紀錄不如第一次多,但從朝鮮方面的紀錄可知在成宗的堅持之下,進 攻的日期確實沒有達成一致,但就結果而言此次聯合軍事行動實屬成功,憲宗也沒有計較此 事,仍是給予成宗嘉獎;而建州女真經過二度征剿,損失更加慘重、部落更加殘破,曾經強盛 的建州三衛衰弱下去,十六世紀才又逐漸強盛起來。

    綜上所述,在對讀技術的輔助下,我們得以探討兩次成化犁庭事件中明朝與朝鮮之間的互 動,其中可得知朝鮮國王儘管一開始想合理化私下與建州女真往來甚至授予官職的行為,但朝 廷擔心朝鮮與女真會聯合起來與其對抗,因此對此十分忌諱,並下詔嚴厲斥責,在此之後朝鮮 便停止與女真的正式往來;不過由於女真仍持續寇邊,促使朝廷於成化三年決意發兵征剿,並 要求朝鮮出兵協助,朝鮮由於邊境安全的考量而答應,但與朝廷之間的應對非常謹慎,避免再 度被朝廷認為有抗衡之意;然而,朝鮮在戰後本欲伺機殲滅女真,這可能是利用朝廷以夷制 夷的心態,篤定朝廷並不會降下太嚴重的罪責。雖然戰後女真元氣大傷,但仍不斷進犯兩國 邊境,甚至揚言要向朝鮮報仇,這促成了成化十五年第二次的聯合軍事行動,透過對讀段落同 樣可看出朝鮮在應對朝廷時的謹慎,但由於種種不利於朝鮮的情勢,成宗也並不一味地討好配 合,而是盡可能地為朝鮮留有餘地,這也是第二次成化犁庭事件兩軍並沒有一同進攻的原因。

    2. 視覺化工具

    兩次成化犁庭事件發生於成化三年與成化十五年,我們可推測事件發生前明朝廷與建州女真 之間的衝突開始升溫,也可推測事件發生後可能尚有餘波,然而其他年度朝廷與建州女真是否 有發生軍事衝突,除非一一檢視《明實錄》各年的紀錄,否則是難以知曉的。

    不過,透過視覺化工具繪製的軍事事件熱區圖,我們可以在短時間內對每年的衝突頻率有大 致的了解。如前項所提及,建州女真自1466年起開始頻繁寇邊。為了解在此之前建州女真的寇 邊頻率,觀察自1457開始各年的軍事熱區圖,我們可以發現除了1460與1465之外,1457-1464年 的軍事熱區圖中建州並沒有熱點,即這些年度並沒有含有建州二字的軍事段落被識別出來 (以图 6為例)。實際去檢視這些年度的《明實錄》,可發現確實沒有建州女真寇邊的紀錄。至於 為何這段時間建州女真沒有進犯,可能是因為朝廷恩威並施的政策奏效,抑或是其他因素(例如 氣候等),便有待日後的研究者進一步釐清;此處也顯示視覺化工具具有引發研究思路的效用。

    接著觀察1460年(天順四年)的軍事熱區圖,代表建州的熱點顏色極淺(見图 7);該點的 freq = 1,即該年的軍事段落中含有建州的段落只有一段。查看《明實錄》,該軍事段落乃 是十月13日朝鮮世祖上奏英宗,說明該國境內的斡朵里女真與阿比車預謀犯邊,並投奔建州衛 依附李滿住,世祖因而擔心其與李滿住會聯合作亂,英宗聞奏後便命遼東官員遣人到建州曉諭 李滿住。2)阿比車為毛憐衛都督僉事郎卜兒哈(《朝鮮實錄》中為浪孛兒罕)之子,毛憐衛與朝鮮 原本關係密切,然而關係破裂後郎卜兒哈一族遭世祖殺害,其子阿比車因而欲向朝鮮報仇。世 祖希望藉由英宗來消除阿比車這個隱患,而英宗可能也擔心建州衛會因此壯大勢力,所以便出 手干預。1460年並非成化犁庭事件中的重要年分,但透過觀察軍事熱區圖後循線查找,便可發 現此一同樣關乎明、朝鮮、女真三方的資訊。

    同樣的例子還可見於1471年(成化七年)與1475年(成化十一年)。1471與1475兩年的軍事 熱區圖中,代表建州的熱點同樣顏色極淺、freq = 1 (图 8, 9),即該年的軍事段落中含有建 州的段落也只有一段。

    查閱《明實錄》,這兩年含有建州的軍事段落同樣牽涉明、朝鮮、女真三方。1471年朝 鮮成宗上奏憲宗,說明李滿住之子欲報第一次成化犁庭事件的殺父之仇,因此請求明軍支援, 憲宗允許了;1475年成宗再次上奏,說明建州女真與毛憐衛聯合進犯,請求憲宗下詔斥責,兵 部尚書頃忠以朝鮮尊事朝廷、曾助朝廷征討建州為由,建議憲宗下詔令建州女真悔過睦鄰,憲 宗也允許了(見表 20)。透過這兩則史料,我們可以看到成化三年的軍事行動之後仍是餘波不 斷,而成宗的上奏除了向憲宗請求協助,或許也有向朝廷表示忠心、不敢任意行動的意涵,呼 應前面所論述成宗的謹慎態度。

    綜上所述,視覺化工具在本研究的應用可歸納為兩點:其一為藉由觀察歷年軍事熱區圖中特 定熱點顏色的深淺,我們可以大致判斷明與建州女真的衝突頻率,作為探討成化犁庭事件的基 礎,也可由此延伸其他議題;其二為觀察非重要衝突年份的軍事熱區圖中的特定熱點,循線查 看《明實錄》後或可發現與成化犁庭事件相關的零星資訊。除了以上二點,視覺化工具是否還 具有其他歷史研究的潛力,有待日後更進一步討論。

    Ⅳ. 結論

    透過對讀技術從《明實錄》與《朝鮮王朝實錄》中抓取的相關段落,我們得以串聯成化犁庭 事件的始末,從兩個不同的視角理解該事件,如此一來除了對事件有更深入的認識,也避免片 面地看待史料而導致偏頗;此外,對讀技術也適合用於發掘不同史書對同一事件在紀錄上的差 異,以及用於觀察跨國軍事行動雙方的行軍路線和時間軸。視覺化工具則使研究者得以從軍事 熱區圖呈現的空間資訊中,對成化犁庭事件的背景相關資訊有大致的了解,也可藉此探索與事 件相關卻零星分散的史料段落。對讀技術與視覺化工具在歷史研究中具有極大的潛力,對兩者 效用進一步的討論與實踐則有待日後繼續進行,並期許能對數位人文的發展做出更多貢獻。

    Figures

    HERC-2-1-131_F1.gif
    本研究提出的框架
    HERC-2-1-131_F2.gif
    《明實錄》軍事事件地點視覺化流程圖
    HERC-2-1-131_F3.gif
    搜索詞擴展算法
    HERC-2-1-131_F4.gif
    釋義識別框架
    HERC-2-1-131_F5.gif
    SPITAC 採用 BERT(Devlin等人,2019)將釋義識別視為句子對分類任務,並預訓練了釋義識別(PI)模型。 句子A和句子B對應於Table 7中呈現的句子對的內容。開頭的特殊標記[CLS]是我們獲取標籤的地方,標記[SEP]用於分割句子對。
    HERC-2-1-131_F6.gif
    圖為1457年(天順元年)的軍事熱點地圖,圖中沒有代表建州的熱點。
    HERC-2-1-131_F7.gif
    圖為1460年(天順四年)的軍事熱點地圖。圖中有一個淺色熱點代表建州。
    HERC-2-1-131_F8.gif
    圖為1471年(成化七年)的軍事熱點地圖,圖中有一個淺色熱點代表建州。
    HERC-2-1-131_F9.gif
    圖為1475年(成化十一年)的軍事熱點地圖,圖中有一個淺色熱點代表建州。

    Tables

    每個類別的使用者提供的種子詞彙。
    預測結果中違法、維修和軍事類別的範例。
    我們研究中違法維修軍事三類別的類別詞彙。
    基於 BERT 的二元分類模型性能。
    展示在外族入侵和總兵官楊信被任命調兵應援情況下的文本分析儘管文本中沒有最初軍事 事件的種子詞彙,模型仍準確學習出文本中的軍事特徵。
    展示了另一個軍事文本案例,其中模型成功地將埋伏等特徵歸類為軍事事件。這證明了,使 用弱標記數據生成器標記的資料,相較於傳統關鍵字搜尋方法,更能有效利用上下文嵌入來快速 識別文本中的關鍵特徵。
    透過句子過濾器,其輸出的句子長度減少到 250 個字。 透過這種方法,我們最終克服了句子長度的限制,同時保留了重要資訊。
    原始資料(original data pairs) 和 paraphrased 資料(paraphrased data pairs)對應十年和特定五年的數量。
    左半部分是英宗的詔書;右半部分是呈給世祖的奏疏。
    左半部分是英宗的詔書;右半部分是呈給世祖的奏疏。
    左半部分是英宗的詔書;右半部分是朝鮮收到的相同詔書。
    左半部分是由白圭等將軍報告的奏疏;右半部分是朝鮮收到的官方文件。
    左半部分與 表 12 相同;右半部分是世祖制定的策略。
    左半部分與 表 12 相同;右半部分是世祖對將領的警告。
    左半部分是李秉和趙輔的報告;右半部分是高台弼的報告。
    左半部分是李秉和趙輔的報告;右半部分是世祖的詔書。
    左半部是憲宗根據高台弼的報告而對世祖的嘉獎;右半部是高台弼的報告。
    左半部分是憲宗給成宗的詔書;右半部分是朝鮮朝臣之間的辯論。
    左半部分是憲宗給成宗的詔書;右半部分是成宗擬定的回答。
    左半部分是成宗的上奏;右半部分是成宗和頃忠的報告。

    References

    1. Chu Y.-T. (2022) SPITAC: Weakly Supervised Learning for Paraphrase Identification with Two-Stage Training in Ancient Chinese Literature. National Central University. Available at: http://ir.lib.ncu.edu.tw:88/thesis/view_etd.asp?URN=109552024 (Accessed: 27 September 2023).
    2. Chen, Y.-J. , Hsieh, H.-Y. , & Tsai, R. T.-H.* (2022). A Novel Semi-supervised Framework to Identify Military Documents: A Quantitative Analysis on Military Records in Ming Shi-Lu. In Proceedings of Digital Humanities 2022 (DH 2022), *Corresponding author.
    3. Devlin, J. et al. (2019) ‘BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding’. arXiv.
    4. Pang, L. , Lan, Y. and Cheng, X. (2021) ‘Match-Ignition: Plugging PageRank into Transformer for Long-form Text Matching’, in Proceedings of the 30th ACM International Conference on Information & Knowledge Management, pp. 1396–1405.
    5. Tsai, R. T.-H.*, Wu, C.-H., Pai, P.-L., & Fan, I.-C. (2020). Automatic Labeled Data Generation for Person Named Entity Disambiguation on the Ming Shilu. In Proceedings of Digital Humanities 2020 (DH 2020), *First and corresponding author. (Digital Humanity Top-1 Conference)
    6. Tsai, R. T.-H. , Lai, Y.-T. , Pai, P.-L. , Wang, Y.-C. , Huang, S. H.-M. , & Fan, I.-C. (2017). WeisoEvent: A Ming-Weiso Event Analytics Tool with Named Entity Markup and Spatial-Temporal Information Linking. In Proceedings of Digital Humanities 2017 (DH 2017), Montreal, Canada.
    7. Meng, Y. , Zhang, Y. , Huang, J. , Xiong, C. , Ji, H. , Zhang, C. and Han, J. (2020). Text Classification Using Label Names Only: A Language Model Self-Training Approach. Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP). Online: Association for Computational Linguistics, pp.9006-9017.
    8. Wang Z. (2005). A Study of the Relations Between the Early Stages of Korea and Jianzhou Nuzhen in the Ming Dynasty. Beijing: Chinese Literature and History Press.
    1. SEARCH
    2. 온라인 투고 시스템

      (Online Submission)

    3. 한문교육연구소

      (Institute for Han-Character
      Education Research)

    4. 편집부
      (Editorial Office Contact)

      - Tel: +82-31-8005-2661
      - E-mail: iher_dku@outlook.com