The CJK Dictionary Institute
CJKI

ENG   


辞書
データ資源
コンサルティング
日本語
中国語
韓国語
アラビア語
辞書類


ウェブサイト
文献・論文
日中韓辭典研究所
漢英字典刊行会
春遍雀來(Jack Halpern)
リンク

主な中国語辞書データ資源

Principal Chinese Lexical Resources
当研究所の中国語辞書データ資源は簡体中文(SC)と繁体中文(TC)の両方に対応している。一般語彙、専門用語、固有名詞、企業名等を網羅したデータ資源は現在約300万項目を数え、機械翻訳(MT)、知的情報検索(IR)、入力システム(IME)といった幅広い用途に活用されている。中国語辞書データ資源の統計情報はここ を参照。


  1. 中国語語彙データベース 簡体字と繁体字それぞれ約50万項目に迫る一般語彙及び人名を収録。形態素解析、情報検索、固有名抽出等の自然言語処理アプリケーションは特に推奨。 このデータベースは中国語情報処理の分野に多大な貢献をするものである。

  2. 中国語固有名詞データベース これは包括的な中英データベースであり、簡体字と繁体字で200万項目程の人名、地名、企業名等を収録。 中国語語彙データベースと組み合わせることにより、中国語の言語技術アプリケーションにおいて他の追随を許さない効果を発揮する。

  3. 速報  日中英専門用語辞書 2005年秋に発表。コンピュータ・IT用語を初めとする幅広い分野を収録し、充実した内容を誇る。

  4. 速報  日中英韓固有名詞辞書 2005年秋に発表。日本語・簡体中文・繁体中文・英語・韓国語による固有名詞辞書。

  5. 新規更新 英中辞典簡体版 8万語超の一般語彙及び重要な固有名詞を収録した英中辞典。10万語に拡張可能。

  6. 拡張 英中・中英コンピュータ用語辞典 簡体字と繁体字のコンピュータ用語を収録。 最新用語を取り入れるべく随時更新され、現在10万項目を突破。

  7. 拡張 日中英コンピュータ用語データベース 簡体字と繁体字の両方を収録した多言語データベース。

  8. 拡張  中英新語辞典 当研究所の中国語編纂者による、包括的な中国語の新語データベース。

  9. 中国語形態素データベース 当研究所の中国語派生接辞データベースの活用により、未知の複合語の認識や表現抽出が可能となる。MT、NLP及びIRアプリケーションに最適である。

  10. 中国語の頻度統計 巨大なコーパスに基づいた中国語の包括的語彙統計データベース。単語や文字の出現頻度等の情報を含み、NLPアプリケーションや携帯電話の入力システム等に活用できる。

  11. 台湾と中国大陸のピンイン差異 約260万のピンイン読みから成る大型データベース。 台湾発音と中国発音の違いは特筆に価すると言って良い。

  12. 英中辞典繁体版 8万語程の一般語彙及び重要な固有名詞を収録した英中辞典。

  13. 簡繁対応表 中国語表記の高度な簡繁間変換を支援する、表記及び語彙素対応表。数万の固有名詞を網羅している。

  14. 繁簡語彙対応表 繁簡対応表の中から語彙対応部分のみ抜粋したもの。この対応表は全て双方向、つまり簡繁、繁簡のどちらでも同じ様に有効である。

  15. 日中固有名詞辞書 日本語の固有名詞約十万六千語を簡体字で表記。一般的な人名や地名だけに留まらず、珍しいものも収録してある。

CJKI ホームへ