漢文パーサ1号
返り点から統語構造を読み取り、XMLで出力します。
toDo:
返り点のエラーチェック。
約物の扱いはどうする?
大量データの一括変換。
バグ:
非㆔所㆓㆐以成㆒㆑教也(㆐のために三と二が連続;余計な"cp"が入る)
入力データ見本:
返り点サンプル
参考:
山崎直樹「訓点付き漢文の返り点から統語情報を導出しXMLで構造化する試み」(『漢字文献情報処理研究』第8号, 2007.10)