中国語学の研究者のためのインターネットリソース

概要
中国語学の研究の際に使えるネット上のリソースを紹介する。電子化された論文のありかや、コーパス・辞書類、中国語入力ツールなど。

はじめに

今日は、中国語学の研究者にとって役に立つであろうインターネットリソースを紹介したいと思う。インターネット上には、さまざまな研究上のリソースがあり、中国語学もその例外ではない。先行研究を探したり、研究のためのデータを見るのにも、インターネット上のリソースが有用である。

この記事では、まず中国語学関連の論文を手に入れられる場所を紹介し、次に中国語に関するオンラインコーパスや辞書を紹介する。また、このほか、中国語の入力や形態素解析に使えるツールなども紹介する。

一応、研究者向けに書いたのだが、オンライン辞書や中国語の入力ツールは、一般の中国語学習者にも役立つだろうから、参考にしていただければ幸いである。

電子化された論文を手に入れる

学術誌に投稿された論文は、多くが電子化され、インターネットを通じて手に入れることができる。無料のところもあるが、有料のところもある。有料の論文は、自分が所属している大学などの研究機関が、まとめて購入していることがある。このため、自分の研究機関のネットワークから手に入る可能性がある。

具体的にどの論文を見るか決めておらず、キーワードから論文を探したいという場合は、Google Scholar を使うと検索しやすい。論文の本文が PDF などで読むことができる場合は、リンクを表示してくれるの便利である。

CNKI

中国大陸の学術誌の多くは、CNKI(中国知网)というサイトに登録されており、ここから論文をダウンロードすることができる。ただし、このサイトは有料である。自分の研究したいことのキーワードをCNKIの検索欄に入れるだけで、さまざまな論文が見つかるはずである。

CNKIでダウンロードできる学術誌のうち、中国語学関連のものとしては以下のようなものがある。

この他、CNKIには、中国大陸の大学の紀要も数多く登録されており、こういった紀要に載っている中国語学関係の論文をダウンロードすることもできる。

Persée

Persée は、フランスの人文・社会科学に関する学術誌を集めたWebサイトである。無料。インターフェースは、基本的にフランス語だが、英語に変更可能。

フランスで出されている学術誌として、Cahiers de Linguistique Asie Orientale というものがあり、これに中国語学の論文が色々と載っている。フランスで出ている学術誌であるため、フランス語で書かれた論文もあるが、英語で書かれた論文もあるので、探してみると自分の研究と関わりのある論文を見つけられるかもしれない。

journal@rchive

journal@rchive は、日本の様々な学術誌を集めたWebサイトである。無料。

中国語学関係の学術誌としては、『中国語学』が掲載されている。また、関連する分野の学術誌として、日本言語学会の『言語研究』や言語処理学会の『自然言語処理』も掲載されており、論文をダウンロードできる。

その他の言語学関連の論文がダウンロードできるWebサイト

中国語学専門の雑誌ではない言語学関連の雑誌に掲載された論文がダウンロードできるWebサイトをまとめて紹介しておこう。これらはみな有料である。基本的に英語。このあたりは、論文のタイトルなどを、Google Scholar で検索すれば、だいたい各論文のページへのリンクが見つかる。

コーパス

中国語学の研究に当たっては、中国語の実例を見る必要が出てくる。このとき役に立つのがコーパスである。中国語のデータを収録したコーパスとしては以下のようなものがある。

中央研究院現代漢語語料庫

台湾の中央研究院が公開した現代中国語のコーパス。オンラインの検索画面から用例を検索する。およそ489万語(795万字)とそれほど規模は大きくないが、しっかりと設計されたコーパスであり、バランスもとられている。

検索対象のジャンルも指定でき、オンラインで使えるコーパスとしてはかなり優秀である。

北京大学漢語語言学研究中心のコーパス

通称CCL。オンラインの検索画面から、現代中国語と古典中国語のコーパスでの用例を見ることができる。北京大学漢語語言学研究中心のWebサイトのメニューから「语料库」を選ぶことで、コーパスのページに入る。

現代中国語と古典中国語と合わせて4億7700万字と分量だけで言えば、かなり巨大なコーパスであり、中国語のコーパスとしては最大級であろう。しかし、このコーパスの材料となっている文章はかなり適当に集められている面がある [1] 。例えば、外国語で書かれた作品の中国語訳 [2] なども、データとして収められている。また、魯迅のようなかなり昔の作家の文章も収められているので、最近の中国語を調べたい場合に適切でないことがある。

このため、このコーパスの結果は鵜呑みにしてはならない。データ自体がバランスがとれていおらず、偏っているのである。このコーパスでのヒット数が多いからどうなるといった議論は差し控えるべきであろう。

関西大学現代中国語コーパス

中国語の教科書をコーパスにしたものなどがある。オンラインで検索可能。ジャンルが限られているので、使いどころは難しいかもしれない。インターフェースが若干使いづらい面もある。

LIVAC

現代中国語のニュースのテキストをコーパスにしたもので、オンラインで検索可能。LIVAC は、Linguistic Variations in Chinese Speech Communities の略で、中国本土だけでなく香港・シンガポールなどのものもデータとして収められている。中国語の地域差の観察に使えるかもしれない。インターフェースは基本的に英語だが、中国語に変更可能。

辞書類

オンラインで無料で検索できる中国語の辞書は少なくない。

北辞郎

ユーザ参加型の中日辞書で、有志が項目を追加している辞書である。新語や俗語の記載が比較的多い気がする。

Naver中国語辞書

日中・中日辞書。小学館の『ポケットプログレッシブ中日・日中辞典』のデータを使っている様子。漢字の手書き入力ができる点が嬉しい。また、発音も聞ける

インターフェースといい、内容といい、申し分の無いWebサイトである。

WEB支那漢

田中慶太郎という人が、1940年に出した『支那文を讀む爲の漢字典』という辞書をオンラインで使えるようにしたもの。この辞書は、古典中国語と現代中国語を特に分けずに収録している。青蛙亭漢語塾のトップメニューから「WEB支那漢」というリンクをたどると、『支那文を讀む爲の漢字典』が出てくる。

なお、このWebサイトについては、以前簡単な紹介を書いたので、それも参照されたい。

百科事典など

Wikipedia を始めとして、オンラインにはさまざまな百科事典サイトが存在する。百科事典をうまく活用すると、普通の中国語の辞書に載っていないような専門用語の意味を調べることができる。例えば、日本語では言い方を知っているが、中国語では言い方を知らないという専門用語があったとしよう。そういった場合、まず、日本語版Wikipedia で、その専門用語を調べる。すると、(デフォルトでは)ページの左側に他言語へのリンクがあるので、そこで中文へのリンクをたどれば、簡単に中国語訳を調べることができる。

なお、中国語版Wikipedia では、大陸・台湾・香港などでそれぞれ言い方が違う場合、そのことについて詳しく書いてあるので、そういったことを調べるのにも役立つ。ちなみに、Bookends というWebサイトで、中国語版Wikipedia をEPWING形式の電子辞書にしたものが配付されている。ダウンロードして、EPWING形式の辞書を読むためのソフトを用意すると、オフラインでも中国語版Wikipedia を読むことができる。

中国大陸で作られている百科事典サイトとしては、「百度百科」というものがあり、これもそこそこ役立つ。

中国語を入力するために

中国語を研究する場合、当然中国語を入力する機会が出てくるだろう。基本的には、自分の使っているOSに付属している中国語入力IMEを利用すれば良いが、以下に挙げるように他の手段もある。

オンラインの中国語入力サービス

中国語学の研究者ならば、自分のPCに中国語のIMEなどをあらかじめ入れてあるとは思うが、出かけた先でPCを借りるといったときに中国語のIMEがないということがあるだろう。こういったときは、ブラウザを使ってオンラインで中国語が入力できるサービスを利用すると良い。

中国語IME

今のWindowsやMacintoshは、日本語版であっても、最初から中国語のIMEが使える。また、Windowsユーザならば、以下のようにオンラインで配付されている中国語IMEをダウンロードして使っても良い。

漢字をピンインに変換する

すでに漢字になっている中国語の文章をピンインにしたいという場合もあるだろう。そういった場合は、Google翻訳が使える。実は、Google翻訳に、中国語の文章を入れると、入力欄の下に、ピンインが表示される。上で紹介したNaver中国語辞書でも、「単語分析ツール」というものが提供されており、オンラインで中国語の文章にピンインをつけてくれる。また、karak というWebサイトでは、Pinconv というWindows用のテキストエディタが配付されている。このPinconv は、漢字をピンインに変換する機能を持っている。

簡体字⇔繁体字の相互変換を行う

Google翻訳で、「原文の言語」を「中国語」にして入力欄に繁体字で書かれた中国語を入れ、「翻訳する言語」に「中国語(簡体)」を指定すると簡体字の中国語になる。逆に、「原文の言語」を「中国語」にして入力欄に簡体字で書かれた中国語を入れ、「翻訳する言語」に「中国語(繁体)」を指定すると繁体字の中国語になる。

形態素解析

形態素解析を使うと、文を単語に分けたり、単語の品詞をつけることなどを自動的に行うことができる。

その他

その他、中国語学で使えそうなWebサイトを挙げよう。

東外大言語モジュール 中国語

東京外国語大学が開発した中国語学習のためのWebサイト。割合と初歩的な内容ばかりなので、中国語学を研究している人にとって、学習の面では役に立たないだろう。しかし、中国語のごく簡単な分類語彙表があったり、会話のデータについても北京だけでなく、蘇州なまりの普通話や台湾国語の音声があったりするので、活用法次第では役立つだろう。

漢字データベースプロジェクト

CJK統合漢字に関するデータベース。説文解字注や廣韻などのデータも配付している。

脚注
  1. データとして追加しやすいところから手当たり次第に追加していったのではないかという疑いすら抱くのだが、その辺のところはよく分からない。 []
  2. 外国語からの翻訳は、原語の影響を受けて、本来の中国語では使わないような語法が用いられることが少なくない。 []