また例によってニッチなことを、って「 iVoca でローマ字入力に対応」のために必要だったからなんだけど。 使って良い文字種の範囲に収まっているか、なら正規表現で簡単にチェックできる。 拗音の類(小さいゃゅょぁぃぅぇぉ)や促音(小さいっ)は周りの文字によって正しい位置かそうでないかが決まるので、そう簡単にはいかない。 「はゅーん」とかライトノベルの準ヒロインが言いそうな言葉、ローマ字でどう打ったらいいかわかりませんなんて問い合わせがサポートに来たらめんどくさい。 ネットで探しても見つからなかったので、がんばって拗音や促音が正しい位置にあるかどうかチェックする正規表現を書いてみた。 同じように困って探している人があるいはもしかしたらいるかもしれないので、ここでさらしてみる。 これらの正規表現は UTF-8 の文字列に対して、正しくない場所に拗音や促音があればマッチする。 見やすさのために正規