pykakasiの使い方

はじめに

ファイル操作などをする際、ファイル名に日本語が使えないという場面に多々出くわす。
そういう時に使用する「pykakasi」についてメモ。

pykakasiとは

ひらがな、カタカナ、漢字、もしくはこれらの複合文をローマ字に変換するpythonライブラリ。

ソースコード

以下のようにして使う。

import pykakasi

kakasi = pykakasi.kakasi()  # インスタンスの作成
kakasi.setMode('H', 'a')  # ひらがなをローマ字に変換するように設定
kakasi.setMode('K', 'a')  # カタカナをローマ字に変換するように設定
kakasi.setMode('J', 'a')  # 漢字をローマ字に変換するように設定
conversion = kakasi.getConverter()  # 上記モード設定の適用

print(conversion.do('ねこ'))
print(conversion.do('ネコ'))
print(conversion.do('猫'))
print(conversion.do('猫 ねこ ネコ neko'))

実行結果は以下となる。

neko
neko
neko
neko neko neko neko

注意点

例えばローマ字を漢字にしたりはできない。これを指定するとエラーになる。

OKパターン
ひらがな or カタカナ or 漢字→ローマ字
カタカナ or 漢字 → ひらがな
ひらがな or 漢字 → カタカナ
NGパターン
ひらがな or カタカナ or ローマ字 → 漢字
ローマ字 → ひらがな
ローマ字 → カタカナ

参考にしたサイト

RURUK BLOG