语料库

语料库(コーパス、corpus)是指一个由大量文本或语言材料组成的数据库,用于语言学研究、语言学习和自然语言处理等领域。语料库可以是书面文本、口语录音、对话记录等,包含丰富的语言数据,帮助研究者和学习者分析语言的使用方式和规律。

资讯

Aozora Bunko corpus(芝加哥大学提供的青空文库语料库检索系统)

该语料库包含青空文库网站(https://aozora.gr.jp)上所有已过版权保护期的文本合集。与“古腾堡计划”类似,这是一个始于1997年的众包项目,通过手工录入的方式整理了成千上万的日本小说、诗歌、戏剧、随笔及其他体裁的作品。截至2017年,该网站已收录超过15,000部作品,涵盖了现代时期大多数主要文学人物。我们的语料库还整合了青空文库志愿者为每部作品提供的详尽元数据,并为大约一半的文本补充了首次出版日期。随着青空文库不断新增的文本和作者,该语料库也将持续更新。
资讯

青空文库的全文检索系统

青空文库提供无版权的日本文学作品,但阅览和检索有一定的繁琐性。这里存在一些青空文库的全文检索系统,可以通过这些工具对青空文库的全文进行关键词检索。
资讯

「北京日本語学習者縦断コーパス」于中纳言公开

「北京日本語学習者縦断コーパス」学习者语料库于检索系统中纳言公开,可以在注册中纳言后于网络版使用该语料库。
资讯

中文语料库的构建和使用方法

对于 BCC、CCL 等中文语料库,以及使用搜索引擎进行语料收集等技巧,这里有一篇文章进行了详细的说明和解释。基本上(基于日中研究)的中文语料库使用方法指南都可以在这里找到。
资讯

NINJAL(国语研)研讨会「コーパス利用のべし・べからず」(2023年11月5日)全 6 期讲座录像公开

日本国立国语研究所的 2023 年研讨会「コーパス利用のべし・べからず」(NINJALシンポジウム「コーパス利用のべし・べからず」(2023年11月5日))系列视频(全 6 期)于 Youtube 免费公开。
资讯

日语语料库工具「中纳言」使用方法教学

在日语的学习和研究中,可能会遇到一系列语料库工具,其中最主流的就是「中纳言」工具。但是「中纳言」有些复杂,不容易上手。在学习「中纳言」使用时,可以参考如下的教学视频。
资讯

日语用例、例句快速查询网站

日常中经常有需要查询日语用例和例句的时候。有两个工具可以做到立刻查询日语的用例。
资讯

国立国语研究所《语言学讲座》系列

日本国立国语研究所提供一系列视频课程「動画教材 : 言語学レクチャーシリーズ (試験版)」。目前已经更新到23讲。内容以日语语言学、语料库、社会语言学等为主。内容专业且精华,适合日语学习者观看。
资讯

日语搭配查询工具、日语搭配辞典

目前的日语教育中越来越强调搭配和接续的重要性。关于日语的コロケーション,有许多查询工具,可以辅助学习和教学。
资讯

日本国立国语研究所的资源导航

在平时的日语教学与研究中,经常会用到日本国立国语研究所的资源。在最新版的国立国语研究所官网中,对应的数据库和语料库资源分别被归到如下两个页面。