大学院等高度副プログラム

プログラム概要及び教育目標

　情報メディアとしてのパーソナルコンピュータ、インターネットの普及により、文書・資料の電子化が急速に進み、電子テキストの量は爆発的に増大しています。これにともない、膨大な自然言語データの中から有益な情報を効率的に抽出するための情報マイニング技術の開発が学界のみならず産業界においても求められています。大規模な自然言語データを分析・活用するためには、従来の言語学、文献学の理論・方法論に加え、情報工学、統計数理学、行動科学など関連領域の知見を統合した学際的なアプローチが必要となります。

　そこで、本プログラムでは、自然言語処理とコーパス言語学研究を二本の柱として、それぞれの基礎理論と応用実践の方法論を有機的に組み合わせて教授します。自然言語処理では、情報工学の基礎理論から、形式言語理論や形式論理に基づいた統語処理・意味処理・談話処理について学びます。さらに、自然言語処理モデルを計算機に実装するためのプログラミングや、言語処理ツールを駆使する技法を習得します。コーパス言語学研究では、コーパスデザインに関する理論や、TEI (Text Encoding Initiative:言語データ電子化のため国際共通規格)、言語データ解析のための統計数理モデルに関する講義を行うとともに、実践的なコーパス分析の演習を行います。

　当プログラムが提供するコースワークを通して、受講生は、膨大な自然言語データの中から自分や社会のニーズに合致した情報の鉱脈を掘り当て活用する高度な情報マイニング能力を修得できるでしょう。

詳細はこちら