
|
基本仕様 |
|
|
概要 |
日中韓辭典研究所は日中韓各語(CJK)の音声学及び音韻論の研究や音声・音韻データベースの開発に力を注いでおり、日本語音韻データベース(JPD)はその開発活動の一環である。JPDの音声表記は日本語の固有名詞や語句が実際の発話でどの様に発音されるかを示すもので、仮名表記はもとより詳細な音素表記でも表し得ない正確な情報を提供する。 JPDの開発には日本語方言学の専門家を含む経験豊富な日本語編集者が当たっており、下記を含む様々な方面での活用が期待できる: 1. 音声合成システム(テキスト音声生成、TTS) 2. 外国語としての日本語の習得の手引きとなる教授法の研究 3. 日本語音声技術の研究開発全般 |
|
特徴 |
1. 音素表記、音声表記、アクセントを初めとする詳細な音韻情報 2. 品詞その他の文法情報 3. 固有名詞に於ける分類コード等の属性情報 |
|
編集方針 |
日本語音韻データベースは、自然言語処理を初めとする音声技術への貢献を目指し、専門知識を持つ経験豊かな編集者によって構築される音韻・音声データベースである。データにはIPA(国際音声記号)を初め、音素表記・音声表記等様々な情報が収録されている。内容の詳細については、下のデータサンプルと併せて「日本語音声技術への挑戦」 をお読み戴きたい。 |
|
フィールド解説 |
||||||||||
|
1 |
日本語 |
仮名・漢字を含む日本語表記 |
||||||||
|
2 |
品詞 |
品詞コードその他の文法情報 |
||||||||
|
3 |
分類 |
地名・人名、更に姓・男性名・女性名等、固有名詞の性質を特定するための分類情報 |
||||||||
|
4 |
アクセント |
経験豊富な日本人編集者によって付与された、東京地域に於ける標準的な高低アクセント情報。名前のアクセントは地域や話者個人によって異なるため、厳密な意味での「正しいアクセント」は存在せず、一つの名前が複数の違ったアクセントで使われることもある。 数字はアクセントが置かれるモーラ(拍)を示し、次の拍から下がることを意味する。例えば [1]は、最初の拍が高く(アクセントがあり)2番めの拍からは低い頭高型を意味する。また[0]は、後続助詞も含めて下がる箇所のない平板型を意味する。(詳細については「日本語音声技術への挑戦5.高低アクセント」参照のこと) |
||||||||
|
5 |
読み |
片仮名による読み |
||||||||
|
6 |
片仮名 |
読みだけでは判断出来ない発音を示す。これによって鼻音化や無声化等の顕著な特徴は把握出来るが、更に語全体の正確な発音は音声表記情報によって明らかになる。
|
||||||||
|
7 |
音素表記 |
ローマ字による音素表記。読みや片仮名音素表記では分かり難い音韻情報がかなり明確に示さjpd_jれるが、音声表記で明らかになる異音変異等の詳細情報は含まない。 |
||||||||
|
8 |
音声表記 |
音素表記のみでは正確で自然な日本語の発音を知るには不十分である。そのために必要なのが、このIPA国際音声記号による音声表記であり、本データベースに於ける最も重要なフィールドである。IPAは一般的に使われている従来の発音記号よりも精度が高く、異音変異を伴う実際の発音にかなり近い。(更に厳密な精密表記の付与も可能だが、内容が煩雑過ぎてあまり勧められない) |
||||||||
|
9 |
備考 |
異音変異等の情報 |
||||||||
|
10 |
ランク |
日本語コーパスその他の語彙情報に基く頻度情報 |
||||||||
以下が日本語音韻データベース(JPD)の見本である。最大の特徴は、IPA(国際音声記号)による音素表記とアクセント情報であり、これによって無声化・鼻音化を含む様々な異音変異の詳細やアクセントパターンをかなり高い精度で知ることが出来る。異音変異は、母語話者にとって日常特に意識されることはないが、自然な音声合成には大きな影響を与えるものである。
|
日本語 |
品詞 |
属性 |
アクセント |
読み |
片仮名 |
音素表記 |
音声表記 |
備考 |
|
鏡 |
NC |
- |
3 |
カガミ |
カガ&ミ |
kagami |
kaŋami |
有声軟口蓋鼻音 |
|
鏡 |
NC |
- |
3 |
カガミ |
カガミ |
kagami |
kaɡami |
有声軟口蓋閉鎖音 |
|
鏡 |
NC |
- |
3 |
カガミ |
カガ&ミ |
kagami |
kaɣami |
有声軟口蓋摩擦音 |
|
危ない |
AJ |
- |
0 |
アブナイ |
アブナイ |
abunai |
abɯnai |
有声両唇破裂音 |
|
危ない |
AJ |
- |
0 |
アブナイ |
アブナイ |
abunai |
aβɯ̥nai |
有声両唇摩擦音 |
|
飾り |
NC |
- |
0 |
カザリ |
カザリ |
kazari |
kazaɾi |
有声歯茎硬口蓋摩擦音 |
|
ザリガニ |
NC |
- |
0 |
ザリガニ |
ザリガ&ニ |
zarigani |
dzaɾiɡaɲi |
有声歯茎硬口蓋破擦音・有声硬口蓋鼻音 |
|
新聞 |
NC |
- |
0 |
シンブン |
シンブン |
siNbuN |
ɕimbɯɴ |
|
|
自分 |
NC |
- |
0 |
ジブン |
ジブン |
zibuN |
dʑibɯɴ |
有声歯茎硬口蓋破裂音の弱化(摩擦音化) |
|
比較 |
VN |
- |
0 |
ヒカク |
ヒ^カク |
hikaku |
hi̥kakɯ |
[hi]の無声化 |
|
比較 |
VN |
- |
0 |
ヒカク |
ヒカク |
hikaku |
hikakɯ |
無声化母音無し |
|
続く |
V5 |
- |
0 |
ツヅク |
ツ^ヅク |
tuzuku |
tsɯ̥zɯkɯ |
[tsɯ]の無声化 |
|
続く |
V5 |
- |
0 |
ツヅク |
ツヅク |
tuzuku |
tsɯzɯkɯ |
無声化母音無し |
|
恥 |
NC |
- |
2 |
ハジ |
ハジ |
hazi |
haʑi |
歯茎硬口蓋摩擦音 |
|
恥 |
NC |
- |
2 |
ハジ |
ハジ |
hazi |
hadʑi |
歯茎硬口蓋破擦音 |
|
蜂 |
NC |
- |
0 |
ハチ |
ハチ |
hati |
hatɕi |
|
|
八 |
NC |
- |
2 |
ハチ |
ハチ |
hati |
hatɕi |
|
|
鵜 |
NC |
- |
1 |
ウ |
ウ |
u |
ʔɯʔ |
声門閉鎖音化 |
|
あっ |
I |
- |
1 |
アッ |
アッ |
aQ |
aʔ |
声門閉鎖音化 |
|
運動 |
VN |
- |
0 |
ウンドウ |
ウンドウ~ |
uNdoo |
ɯndoː |
|
|
病院 |
NC |
- |
0 |
ビョウイン |
ビョウ~イン |
bjooiN |
bʲoːiɴ |
有声硬口蓋化音 |
|
美容院 |
NC |
- |
2 |
ビヨウイン |
ビヨ'ウ~イン |
bijooiN |
bijoːiɴ |
|
|
宴会 |
NC |
- |
0 |
エンカイ |
エンカイ |
eNkai |
eŋkai |
|
|
蒟蒻 |
NC |
- |
0 |
コンニャク |
コンニャク |
koNnjaku |
koɲɲakɯ |
歯茎鼻音、有声硬口蓋鼻音 |
|
本 |
NC |
- |
1 |
ホン |
ホ'ン |
hoN |
hoɴ |
口蓋垂鼻子音 |
|
本 |
NC |
- |
1 |
ホン |
ホ'ン |
hoN |
hõ |
前舌狭口鼻母音 |
|
本案 |
NC |
- |
1 |
ホンアン |
ホ'ンアン |
hoNaN |
hoãɴ |
後舌狭口鼻母音(撥音の前の母音が微鼻音化) |
|
本意 |
NC |
- |
1 |
ホンイ |
ホ'ンイ |
hoNi |
hõĩ |
前舌狭口鼻母音 |
|
本会議 |
NC |
- |
3 |
ホンカイギ |
ホンカイギ |
hoNkaigi |
hoŋkaiŋi |
軟口蓋鼻音 |
|
本棚 |
NC |
- |
1 |
ホンダナ |
ホ'ンダナ |
hoNdana |
hondana |
歯茎鼻音 |
|
本箱 |
NC |
- |
1 |
ホンバコ |
ホ'ンバコ |
hoNbako |
hombako |
|