日本語コーパス活用入門

NINJAL-LWP実践ガイド

内容

日本語研究は新たな段階へ

急速に普及しつつある日本語コーパスの活用法を紹介する初のガイドブック。『現代日本語書き言葉均衡コーパス』『筑波ウェブコーパス』を検索するためのツールNINJAL-LWPの開発・公開に関わった3名が執筆。コーパス初心者を念頭に、ツールの利用法の解説にとどまらず、背景知識や研究への具体的応用までを幅広く取りあげる。

目次

まえがき

<基礎編>コーパスとコーパスツールの基礎

第1章 日本語コーパスとコーパスツール

1.1 コーパスとは何か
1.2 コーパスはどのように作るか
1.3 コーパスによる分析とはどのようなものか
 1.3.1 頻度分析
 1.3.2 コロケーション分析
 1.3.3 用例分析
1.4 コーパスにはどのような種類があるか
1.5 コーパスツールにはどのようなものがあるか
 1.5.1 ワードリスト
 1.5.2 コンコーダンス
 1.5.3 統計サマリー
 1.5.4 レキシカルプロファイリング
1.6 利用可能なオンラインの日本語コーパスとツール
 1.6.1 BCCWJとそのツール
 1.6.2 筑波ウェブコーパスとそのツール
 1.6.3 Sketch Engineの日本語コーパス

第2章 NINJAL-LWPの機能

2.1 見出し語リスト
2.2 表記の扱い
2.3 見出し語に関する統計情報
2.4 文法パターンの選択
2.5 コロケーションの分析
 2.5.1 MIスコア
 2.5.2 ログダイス
 2.5.3 3つの指標の比較
 2.5.4 コロケーションのフィルタ機能
 2.5.5 サブコーパスごとのPMW
 2.5.6 固有名詞のラベル
2.6 用例の分析
 2.6.1 出典の確認
 2.6.2 文脈の確認
 2.6.3 用例のフィルタ機能
 2.6.4 用例のダウンロード
2.7 2語の比較
 2.7.1 比較する2語の選択
 2.7.2 2語比較画面
 2.7.3 文法パターンや基本統計の比較
 2.7.4 コロケーションの比較
 2.7.5 用例の比較
2.8 レキシカルプロファイリングの仕組み

<応用編>レキシカルプロファイリングツールNIJAL-LWPの活用

第3章 『基本動詞ハンドブック』の執筆における利用
3.1 語義の認定
3.2 中心義
3.3 例文
3.4 コロケーション
3.5 複合動詞
3.6 複合名詞
3.7 慣用表現
3.8 まとめ

第4章 類義語・対義語・ゆれのある語の調査
4.1 類義語
 4.1.1 「ルール」と「規則」
 4.1.2 「状態」と「状況」
 4.1.3 「上がる」と「登る」
 4.1.4 「開く」と「開ける」
 4.1.5 「寝る」と「眠る」
 4.1.6 「走る」と「駆ける」
4.2 対義語
 4.2.1 頻度と有標/無標
 4.2.2 「近い」と「遠い」
4.3 ゆれのある語
 4.3.1 「大きい」と「大きな」
 4.3.2 「小さい」と「小さな」
4.4 まとめ

<研究編>コーパスに基づく言語研究

第5章 基本動詞「置く」の本動詞用法から補助動詞用法への文法化
5.1 はじめに
5.2 NLB、NLTにおける本動詞用法・補助動詞用法の検索
5.3 本動詞用法から補助動詞用法への意味変化・意味拡張:Indo-Turanian言語地域諸語の研究の知見
5.4 大規模コーパスにおける補助動詞としての「置く・おく」の使用実態
 5.4.1 共起するV1の種類と自他の分布
 5.4.2 否定形のV1との共起
 5.4.3 V1とV2が同じもの:「おいておく」
5.5 まとめ

第6章 語彙的自他動詞対における形式的な有標・無標さの予測
6.1 はじめに
6.2 意味的な動機づけ:認知意味論的なアプローチ
6.3 経済的な動機づけ:頻度論的なアプローチ
6.4 ナロック・パルデシ・赤瀬川(2015)
 6.4.1 「認知意味論的な動機づけ」の不備と問題点
 6.4.2 頻度論的な動機づけ
 6.4.3 コーパス頻度に基づく検証
6.5 まとめ 186

索引

ジャンル