summaryrefslogtreecommitdiff
diff options
context:
space:
mode:
-rw-r--r--_test/cases/inc/utf8_kanaromaji.txt41
-rw-r--r--inc/utf8.php42
2 files changed, 47 insertions, 36 deletions
diff --git a/_test/cases/inc/utf8_kanaromaji.txt b/_test/cases/inc/utf8_kanaromaji.txt
index 9ee47d9a5..d6bf51e95 100644
--- a/_test/cases/inc/utf8_kanaromaji.txt
+++ b/_test/cases/inc/utf8_kanaromaji.txt
@@ -4893,7 +4893,7 @@
よく;yoku
ときどき;tokidoki
ニュース;nyuusu
-ホーム・ドラマ;hoomu dorama
+ホーム・ドラマ;hoomu_dorama
どちらも;dochiramo
あさ;asa
おきる;okiru
@@ -5083,7 +5083,7 @@
しゅっぱん;shuppan
はなし;hanashi
しゅじんこう;shujinkou
-ファッション・モデル;fasshon moderu
+ファッション・モデル;fasshon_moderu
スパイ;supai
ページ;peeji
おもう;omou
@@ -5113,10 +5113,10 @@
びん;bin
ひこうじょう;hikoujou
むかえる;mukaeru
-エア・ターミナル;ea taaminaru
+エア・ターミナル;ea_taaminaru
はこざき;hakozaki
はやい;hayai
-リムジン・バス;rimujin basu
+リムジン・バス;rimujin_basu
だいじょうぶ;daijoubu
かならず;kanarazu
わ;wa
@@ -5242,7 +5242,7 @@
しずおか;shizuoka
つかまる;tsukamaru
ばっきん;bakkin
-パト・カー;pato kaa
+パト・カー;pato_kaa
はらう;harau
そのまま;sonomama
たりる;tariru
@@ -5343,7 +5343,7 @@
びょうき;byouki
あたたかい;atatakai
ちょうし;choushi
-エス・エフ;esu efu
+エス・エフ;esu_efu
うちゅう;uchuu
ちきゅう;chikyuu
ぼうけん;bouken
@@ -5363,7 +5363,7 @@
こい;koi
さいご;saigo
てきこく;tekikoku
-ハッピ・エンド;happi endo
+ハッピ・エンド;happi_endo
きがする;kigasuru
きょうみ;kyoumi
ないよう;naiyou
@@ -5378,7 +5378,7 @@
らいげつ;raigetsu
はなれる;hanareru
しょうご;shougo
-チェック・イン;chekku in
+チェック・イン;chekku_in
けど;kedo
だって;datte
フロア;furoa
@@ -5420,7 +5420,7 @@
いわい;iwai
しょうしん;shoushin
レストラン;resutoran
-カクテル・パーティー;kakuteru paatii
+カクテル・パーティー;kakuteru_paatii
シャンペン;shanpen
クラシック;kurashikku
とくに;tokuni
@@ -5547,7 +5547,7 @@
かつ;katsu
あぶない;abunai
おとなしい;otonashii
-アイス・クリーム;aisu kuriimu
+アイス・クリーム;aisu_kuriimu
あら;ara
じゃ;ja
すな;suna
@@ -5813,7 +5813,7 @@
ふりそで;furisode
がまん;gaman
スキー;sukii
-ウィーク・エンド;wiiku endo
+ウィーク・エンド;wiiku_endo
あいつ;aitsu
ひどいめにあう;hidoimeniau
くん;kun
@@ -5969,7 +5969,7 @@
とちゅう;tochuu
みんしゅく;minshuku
すきま;sukima
-セントラリ・ヒーティング;sentorari hiitingu
+セントラリ・ヒーティング;sentorari_hiitingu
だて;date
げんこう;genkou
ひしょ;hisho
@@ -5978,7 +5978,7 @@
やまなかこ;yamanakako
コート;kooto
ダイヤモンド;daiyamondo
-ハンド・バッグ;hando baggu
+ハンド・バッグ;hando_baggu
ミンク;minku
ゆびわ;yubiwa
わに;wani
@@ -6238,7 +6238,7 @@
しりつ;shiritsu
ここのつ;kokonotsu
みほん;mihon
-エヌ・エッチ・ケー;enu ecchi kee
+エヌ・エッチ・ケー;enu_ecchi_kee
こうきょう;koukyou
しゅるい;shurui
チャンネル;channeru
@@ -6285,7 +6285,7 @@
むすび;musubi
いや;iya
おもい;omoi
-リュック・サック;ryukku sakku
+リュック・サック;ryukku_sakku
おやつ;oyatsu
デザート;dezaato
せんべい;senbei
@@ -6328,8 +6328,8 @@
とし;toshi
ごぞんじです;gozonjidesu
どなたか;donataka
-アップライト・ピアノ;appuraito piano
-グランド・ピアノ;gurando piano
+アップライト・ピアノ;appuraito_piano
+グランド・ピアノ;gurando_piano
がいこくせい;gaikokusei
こくさん;kokusan
くろい;kuroi
@@ -13829,7 +13829,6 @@ AよりBのほうがわかいです;AyoriBnohougawakaidesu
すます;sumasu
かたづけ;kataduke
コップ;koppu
-こおひいぢゃわん;koohiijawan
ナイフ;naifu
フォーク;fooku
スプーン;supuun
@@ -14349,7 +14348,7 @@ AよりBのほうがわかいです;AyoriBnohougawakaidesu
たいしょうてきだ;taishoutekida
めん;men
どうじ;douji
-ルース・ベネディクト;ruusu benedikuto
+ルース・ベネディクト;ruusu_benedikuto
きく;kiku
かたな;katana
こうどうする;koudousuru
@@ -14472,7 +14471,7 @@ AよりBのほうがわかいです;AyoriBnohougawakaidesu
つもる;tsumoru
ふりつづく;furitsuduku
に、さんねん;ni_sannen
-セントラル・ヒーティング;sentoraru hiitingu
+セントラル・ヒーティング;sentoraru_hiitingu
だんぼう;danbou
しゅっきん;shukkin
しゅっきんする;shukkinsuru
@@ -15739,7 +15738,6 @@ AよりBのほうがわかいです;AyoriBnohougawakaidesu
さらさら;sarasara
ぶるぶるふるえる;buruburufurueru
むかう;mukau
-すとーん(と);sutoon(to)
けろりとなおる;keroritonaoru
さむがり;samugari
のびのび(と)くらす;nobinobi(to)kurasu
@@ -20946,7 +20944,6 @@ AよりBのほうがわかいです;AyoriBnohougawakaidesu
あまのがわ;amanogawa
おりひめ;orihime
ハイキング;haikingu
-パーチィー;paatii
まつおばしょう;matsuobashou
つめたい;tsumetai
みじかい;mijikai
diff --git a/inc/utf8.php b/inc/utf8.php
index 7291987b0..99e2fcaa1 100644
--- a/inc/utf8.php
+++ b/inc/utf8.php
@@ -1221,13 +1221,14 @@ $UTF8_ROMANIZATION = array(
'ط'=>'t\'','ظ'=>'z\'','ع'=>'y','غ'=>'gh','ف'=>'f','ق'=>'q','ك'=>'k',
'ل'=>'l','م'=>'m','ن'=>'n','ه'=>'x\'','و'=>'u','ي'=>'i',
- // Japanese characters (last update: 2008-05-08)
-
+ // Japanese characters (last update: 2008-05-09)
+
// Japanese hiragana
// 3 character syllables, っ doubles the consonant after
'っちゃ'=>'ccha','っちぇ'=>'cche','っちょ'=>'ccho','っちゅ'=>'cchu',
'っびゃ'=>'bbya','っびぇ'=>'bbye','っびぃ'=>'bbyi','っびょ'=>'bbyo','っびゅ'=>'bbyu',
+ 'っぴゃ'=>'ppya','っぴぇ'=>'ppye','っぴぃ'=>'ppyi','っぴょ'=>'ppyo','っぴゅ'=>'ppyu',
'っちゃ'=>'ccha','っちぇ'=>'cche','っち'=>'cchi','っちょ'=>'ccho','っちゅ'=>'cchu',
// 'っひゃ'=>'hya','っひぇ'=>'hye','っひぃ'=>'hyi','っひょ'=>'hyo','っひゅ'=>'hyu',
'っきゃ'=>'kkya','っきぇ'=>'kkye','っきぃ'=>'kkyi','っきょ'=>'kkyo','っきゅ'=>'kkyu',
@@ -1243,9 +1244,10 @@ $UTF8_ROMANIZATION = array(
// 2 character syllables - normal
'ふぁ'=>'fa','ふぇ'=>'fe','ふぃ'=>'fi','ふぉ'=>'fo',
- 'びゃ'=>'bya','びぇ'=>'bye','びぃ'=>'byi','びょ'=>'byo','びゅ'=>'byu',
'ちゃ'=>'cha','ちぇ'=>'che','ち'=>'chi','ちょ'=>'cho','ちゅ'=>'chu',
'ひゃ'=>'hya','ひぇ'=>'hye','ひぃ'=>'hyi','ひょ'=>'hyo','ひゅ'=>'hyu',
+ 'びゃ'=>'bya','びぇ'=>'bye','びぃ'=>'byi','びょ'=>'byo','びゅ'=>'byu',
+ 'ぴゃ'=>'pya','ぴぇ'=>'pye','ぴぃ'=>'pyi','ぴょ'=>'pyo','ぴゅ'=>'pyu',
'きゃ'=>'kya','きぇ'=>'kye','きぃ'=>'kyi','きょ'=>'kyo','きゅ'=>'kyu',
'ぎゃ'=>'gya','ぎぇ'=>'gye','ぎぃ'=>'gyi','ぎょ'=>'gyo','ぎゅ'=>'gyu',
'みゃ'=>'mya','みぇ'=>'mye','みぃ'=>'myi','みょ'=>'myo','みゅ'=>'myu',
@@ -1267,7 +1269,7 @@ $UTF8_ROMANIZATION = array(
'っな'=>'nna','っね'=>'nne','っに'=>'nni','っの'=>'nno','っぬ'=>'nnu',
'っら'=>'rra','っれ'=>'rre','っり'=>'rri','っろ'=>'rro','っる'=>'rru',
'っさ'=>'ssa','っせ'=>'sse','っし'=>'sshi','っそ'=>'sso','っす'=>'ssu',
- 'っざ'=>'zza','っぜ'=>'zze','っじ'=>'zzi','っぞ'=>'zzo','っず'=>'zzu',
+ 'っざ'=>'zza','っぜ'=>'zze','っじ'=>'jji','っぞ'=>'zzo','っず'=>'zzu',
// 1 character syllabels
'あ'=>'a','え'=>'e','い'=>'i','お'=>'o','う'=>'u','ん'=>'n',
@@ -1299,7 +1301,6 @@ $UTF8_ROMANIZATION = array(
// 'ぢゃ'=>'dya','ぢぇ'=>'dye','ぢぃ'=>'dyi','ぢょ'=>'dyo','ぢゅ'=>'dyu',
// 'ふぁ'=>'fwa','ふぇ'=>'fwe','ふぃ'=>'fwi','ふぉ'=>'fwo','ふぅ'=>'fwu',
// 'ふゃ'=>'fya','ふぇ'=>'fye','ふぃ'=>'fyi','ふょ'=>'fyo','ふゅ'=>'fyu',
- // 'ぴゃ'=>'pya','ぴぇ'=>'pye','ぴぃ'=>'pyi','ぴょ'=>'pyo','ぴゅ'=>'pyu',
// 'すぁ'=>'swa','すぇ'=>'swe','すぃ'=>'swi','すぉ'=>'swo','すぅ'=>'swu',
// 'てゃ'=>'tha','てぇ'=>'the','てぃ'=>'thi','てょ'=>'tho','てゅ'=>'thu',
// 'つゃ'=>'tsa','つぇ'=>'tse','つぃ'=>'tsi','つょ'=>'tso','つ'=>'tsu',
@@ -1334,7 +1335,9 @@ $UTF8_ROMANIZATION = array(
'ッリャー'=>'rryaa','ッリェー'=>'rryee','ッリィー'=>'rryii','ッリョー'=>'rryoo','ッリュー'=>'rryuu',
'ッシャー'=>'sshaa','ッシェー'=>'sshee','ッシー'=>'sshii','ッショー'=>'sshoo','ッシュー'=>'sshuu',
'ッチャー'=>'cchaa','ッチェー'=>'cchee','ッチー'=>'cchii','ッチョー'=>'cchoo','ッチュー'=>'cchuu',
-
+ 'ッティー'=>'ttii',
+ 'ッヂィー'=>'ddii',
+
// 3 character syllables - doubled vowels
'ファー'=>'faa','フェー'=>'fee','フィー'=>'fii','フォー'=>'foo',
'フャー'=>'fyaa','フェー'=>'fyee','フィー'=>'fyii','フョー'=>'fyoo','フュー'=>'fyuu',
@@ -1360,6 +1363,8 @@ $UTF8_ROMANIZATION = array(
'ヴァー'=>'vaa','ヴェー'=>'vee','ヴィー'=>'vii','ヴォー'=>'voo','ヴー'=>'vuu',
'ウェー'=>'wee','ウィー'=>'wii',
'イェー'=>'yee',
+ 'ティー'=>'tii',
+ 'ヂィー'=>'dii',
// 3 character syllables - doubled consonants
'ッビャ'=>'bbya','ッビェ'=>'bbye','ッビィ'=>'bbyi','ッビョ'=>'bbyo','ッビュ'=>'bbyu',
@@ -1371,6 +1376,8 @@ $UTF8_ROMANIZATION = array(
'ッリャ'=>'rrya','ッリェ'=>'rrye','ッリィ'=>'rryi','ッリョ'=>'rryo','ッリュ'=>'rryu',
'ッシャ'=>'ssha','ッシェ'=>'sshe','ッシ'=>'sshi','ッショ'=>'ssho','ッシュ'=>'sshu',
'ッチャ'=>'ccha','ッチェ'=>'cche','ッチ'=>'cchi','ッチョ'=>'ccho','ッチュ'=>'cchu',
+ 'ッティ'=>'tti',
+ 'ッヂィ'=>'ddi',
// 3 character syllables - doubled vowel and consonants
'ッバー'=>'bbaa','ッベー'=>'bbee','ッビー'=>'bbii','ッボー'=>'bboo','ッブー'=>'bbuu',
@@ -1381,13 +1388,14 @@ $UTF8_ROMANIZATION = array(
'ッナー'=>'nnaa','ッネー'=>'nnee','ッニー'=>'nnii','ッノー'=>'nnoo','ッヌー'=>'nnuu',
'ッラー'=>'rraa','ッレー'=>'rree','ッリー'=>'rrii','ッロー'=>'rroo','ッルー'=>'rruu',
'ッサー'=>'ssaa','ッセー'=>'ssee','ッシー'=>'sshii','ッソー'=>'ssoo','ッスー'=>'ssuu',
- 'ッザー'=>'zzaa','ッゼー'=>'zzee','ッジー'=>'zzii','ッゾー'=>'zzoo','ッズー'=>'zzuu',
- 'ッター'=>'ttaa','ッテー'=>'ttee','ッチー'=>'chii','ットー'=>'ttoo','ッツー'=>'ttssuu',
+ 'ッザー'=>'zzaa','ッゼー'=>'zzee','ッジー'=>'jjii','ッゾー'=>'zzoo','ッズー'=>'zzuu',
+ 'ッター'=>'ttaa','ッテー'=>'ttee','ッチー'=>'chii','ットー'=>'ttoo','ッツー'=>'ttsuu',
'ッダー'=>'ddaa','ッデー'=>'ddee','ッヂー'=>'ddii','ッドー'=>'ddoo','ッヅー'=>'dduu',
// 2 character syllables - normal
- 'ファ'=>'fa','フェ'=>'fe','フィ'=>'fi','フォ'=>'fo',
- 'フャ'=>'fya','フェ'=>'fye','フィ'=>'fyi','フョ'=>'fyo','フュ'=>'fyu',
+ 'ファ'=>'fa','フェ'=>'fe','フィ'=>'fi','フォ'=>'fo','フゥ'=>'fu',
+ // 'フャ'=>'fya','フェ'=>'fye','フィ'=>'fyi','フョ'=>'fyo','フュ'=>'fyu',
+ 'フャ'=>'fa','フェ'=>'fe','フィ'=>'fi','フョ'=>'fo','フュ'=>'fu',
'ヒャ'=>'hya','ヒェ'=>'hye','ヒィ'=>'hyi','ヒョ'=>'hyo','ヒュ'=>'hyu',
'ビャ'=>'bya','ビェ'=>'bye','ビィ'=>'byi','ビョ'=>'byo','ビュ'=>'byu',
'ピャ'=>'pya','ピェ'=>'pye','ピィ'=>'pyi','ピョ'=>'pyo','ピュ'=>'pyu',
@@ -1401,7 +1409,7 @@ $UTF8_ROMANIZATION = array(
'スァ'=>'swa','スェ'=>'swe','スィ'=>'swi','スォ'=>'swo','スゥ'=>'swu',
'デァ'=>'da','デェ'=>'de','ディ'=>'di','デォ'=>'do','デゥ'=>'du',
'チャ'=>'cha','チェ'=>'che','チ'=>'chi','チョ'=>'cho','チュ'=>'chu',
- 'ヂャ'=>'dya','ヂェ'=>'dye','ヂィ'=>'dyi','ヂョ'=>'dyo','ヂュ'=>'dyu',
+ // 'ヂャ'=>'dya','ヂェ'=>'dye','ヂィ'=>'dyi','ヂョ'=>'dyo','ヂュ'=>'dyu',
'ツャ'=>'tsa','ツェ'=>'tse','ツィ'=>'tsi','ツョ'=>'tso','ツ'=>'tsu',
'トァ'=>'twa','トェ'=>'twe','トィ'=>'twi','トォ'=>'two','トゥ'=>'twu',
'ドァ'=>'dwa','ドェ'=>'dwe','ドィ'=>'dwi','ドォ'=>'dwo','ドゥ'=>'dwu',
@@ -1410,6 +1418,8 @@ $UTF8_ROMANIZATION = array(
'ヴァ'=>'va','ヴェ'=>'ve','ヴィ'=>'vi','ヴォ'=>'vo','ヴ'=>'vu',
'ウェ'=>'we','ウィ'=>'wi',
'イェ'=>'ye',
+ 'ティ'=>'ti',
+ 'ヂィ'=>'di',
// 2 character syllables - doubled vocal
'アー'=>'aa','エー'=>'ee','イー'=>'ii','オー'=>'oo','ウー'=>'uu',
@@ -1423,7 +1433,7 @@ $UTF8_ROMANIZATION = array(
'ナー'=>'naa','ネー'=>'nee','ニー'=>'nii','ノー'=>'noo','ヌー'=>'nuu',
'ラー'=>'raa','レー'=>'ree','リー'=>'rii','ロー'=>'roo','ルー'=>'ruu',
'サー'=>'saa','セー'=>'see','シー'=>'shii','ソー'=>'soo','スー'=>'suu',
- 'ザー'=>'zaa','ゼー'=>'zee','ジー'=>'zii','ゾー'=>'zoo','ズー'=>'zuu',
+ 'ザー'=>'zaa','ゼー'=>'zee','ジー'=>'jii','ゾー'=>'zoo','ズー'=>'zuu',
'ター'=>'taa','テー'=>'tee','チー'=>'chii','トー'=>'too','ツー'=>'tsuu',
'ワー'=>'waa','ヲー'=>'woo',
'ヤー'=>'yaa','ヨー'=>'yoo','ユー'=>'yuu',
@@ -1444,8 +1454,8 @@ $UTF8_ROMANIZATION = array(
'ッナ'=>'nna','ッネ'=>'nne','ッニ'=>'nni','ッノ'=>'nno','ッヌ'=>'nnu',
'ッラ'=>'rra','ッレ'=>'rre','ッリ'=>'rri','ッロ'=>'rro','ッル'=>'rru',
'ッサ'=>'ssa','ッセ'=>'sse','ッシ'=>'sshi','ッソ'=>'sso','ッス'=>'ssu',
- 'ッザ'=>'zza','ッゼ'=>'zze','ッジ'=>'zzi','ッゾ'=>'zzo','ッズ'=>'zzu',
- 'ッタ'=>'tta','ッテ'=>'tte','ッチ'=>'chi','ット'=>'tto','ッツ'=>'ttssu',
+ 'ッザ'=>'zza','ッゼ'=>'zze','ッジ'=>'jji','ッゾ'=>'zzo','ッズ'=>'zzu',
+ 'ッタ'=>'tta','ッテ'=>'tte','ッチ'=>'cchi','ット'=>'tto','ッツ'=>'ttsu',
'ッダ'=>'dda','ッデ'=>'dde','ッヂ'=>'ddi','ッド'=>'ddo','ッヅ'=>'ddu',
// 1 character syllables
@@ -1472,6 +1482,10 @@ $UTF8_ROMANIZATION = array(
'ァ'=>'a','ェ'=>'e','ィ'=>'i','ォ'=>'o','ゥ'=>'u',
'ャ'=>'ya','ョ'=>'yo','ュ'=>'yu',
+ // special characters
+ '・'=>'_','、'=>'_',
+ 'ー'=>'_', // when used with hiragana (seldom), this character would not be converted otherwise
+
// 'ラ'=>'la','レ'=>'le','リ'=>'li','ロ'=>'lo','ル'=>'lu',
// 'チャ'=>'cya','チェ'=>'cye','チィ'=>'cyi','チョ'=>'cyo','チュ'=>'cyu',
//'デャ'=>'dha','デェ'=>'dhe','ディ'=>'dhi','デョ'=>'dho','デュ'=>'dhu',