はじめに
ファイル操作などをする際、ファイル名に日本語が使えないという場面に多々出くわす。
そういう時に使用する「pykakasi」についてメモ。
pykakasiとは
ひらがな、カタカナ、漢字、もしくはこれらの複合文をローマ字に変換するpythonライブラリ。
ソースコード
以下のようにして使う。
import pykakasi kakasi = pykakasi.kakasi() # インスタンスの作成 kakasi.setMode('H', 'a') # ひらがなをローマ字に変換するように設定 kakasi.setMode('K', 'a') # カタカナをローマ字に変換するように設定 kakasi.setMode('J', 'a') # 漢字をローマ字に変換するように設定 conversion = kakasi.getConverter() # 上記モード設定の適用 print(conversion.do('ねこ')) print(conversion.do('ネコ')) print(conversion.do('猫')) print(conversion.do('猫 ねこ ネコ neko'))
実行結果は以下となる。
neko neko neko neko neko neko neko
注意点
例えばローマ字を漢字にしたりはできない。これを指定するとエラーになる。
OKパターン
ひらがな or カタカナ or 漢字→ローマ字
カタカナ or 漢字 → ひらがな
ひらがな or 漢字 → カタカナ
ひらがな or カタカナ or 漢字→ローマ字
カタカナ or 漢字 → ひらがな
ひらがな or 漢字 → カタカナ
NGパターン
ひらがな or カタカナ or ローマ字 → 漢字
ローマ字 → ひらがな
ローマ字 → カタカナ
ひらがな or カタカナ or ローマ字 → 漢字
ローマ字 → ひらがな
ローマ字 → カタカナ