コーパス(corpus)は、言語研究や自然言語処理において使用される、大規模な言語データの集まりを指します。これらのデータは、実際の文章や会話を集めたもので、単語の使用頻度や文法の傾向を分析するために使われます。コーパスは、電子的な形式で保存され、検索や分析が容易に行えるように設計されています。
「北京日本語学習者縦断コーパス」が検索システム『中納言』にて公開
「北京日本語学習者縦断コーパス」が検索システム『中納言』にて公開されました。
中国語コーパスの構築と利用方法
BCCコーパス(北京語言大学BCC现代汉语语料库)などの中国語コーパスの使い方と構築の仕方。
青空文庫振り仮名注釈付き音声コーパスが公開
NDLラボ公式GitHub上に、青空文庫振り仮名注釈付き音声コーパスが公開されました。
講義「どうすれば語彙学習負担を減らせるかーコーパスとテストから考える語彙の学習と教育ー 」(松下達彦)
国立国語研究所公式 Youtube より、言語学レクチャーシリーズ(試験版)Vol.25。
NINJALシンポジウム「コーパス利用のべし・べからず」(2023年11月5日)の発表動画(全6本)が公開
NINJALシンポジウム「コーパス利用のべし・べからず」(2023年11月5日)の発表動画(全6本)を公開しました。
言語学レクチャーシリーズ (試験版) Vol.23 「コーパスの検索とデータ構造」(講師 : 山口 昌也) の動画が公開
言語学レクチャーシリーズ (試験版)が国立国語研究所によって公開中。Youtubeや国立国語研究所のHPにて視聴できます。