應用平行語料建構中文斷詞組件
在本論文,我們建構一個基於中英平行語料的中文斷詞系統,並透過該系統對不同領域的語料斷詞。提供我們的系統不同領域的中英平行語料後,系統可以自動化地產生品質不錯的訓練語料,以節省透過人工斷詞方式取得訓練語料所耗費的時間、人力。 在產生訓練語料時,首先對中英平行語料中的所有中文句,透過查詢中文辭典的方式產生句子的各種斷詞組合,再利用英漢翻譯的資訊處理交集型歧異,將錯誤的斷詞組合去除。此外本研究從中英平行語料中擷取新的中英詞對與未知詞,並分別將其擴充至英漢辭典模組與中文辭典模組,以提升我們的系統之斷詞效能。 我們透過兩部分的實驗進行斷詞效能評估,而在實驗中會使用三種不同領域的實驗語料。在第一部分,我們...
Main Authors: | 王瑞平, Wang, Jui Ping |
---|---|
Language: | 中文 |
Published: |
國立政治大學
|
Subjects: | |
Online Access: | http://thesis.lib.nccu.edu.tw/cgi-bin/cdrfb3/gsweb.cgi?o=dstdcdr&i=sid=%22G0099753016%22. |
Similar Items
-
說中文的幼童指涉詞的語用用法
by: 謝雅婷, et al. -
從中介語語料庫探討對外華語「的」字教學語法
by: 張宇虹 -
語料庫及心理語言學為基礎之研究: 以[Do/Make+Noun] 為例
by: 謝怡箴, et al. -
界定日語中的分類詞
by: 王維, et al. -
以語料庫為本之近似詞教學成效之研究:以台灣大學生為例
by: 陳聖其, et al.