掲示板システム
ホーム
アクセス解析
カテゴリ
ログアウト
漢字かどうかの判断 (ID:145365)
名前
ホームページ(ブログ、Twitterなど)のURL (省略可)
本文
> 漢字かどうかの判断が判りません。 そもそも何故、漢字かどうかの判断が必要なのでしょうか? それによって、記述すべき判断基準も異なってくるかと思います。 とくに、それらの文字データがどのように渡されるのかが争点になります。 String 型として渡されるのであれば、それらは Unicode にて処理されるため、 Shift_JIS の重複文字などは判断できないでしょう。 http://support.microsoft.com/kb/170559/ja String ではなく、バイナリとしての入力(Byte配列やStream等)であるならば、 それらの文字コードが明らかにされねばなりません。 それから、漢字の部首を表す文字や、記号(特に、漢字を含むもの)はどうしますか? TextBox1.Font = New Font("MS ゴシック", 18) TextBox1.Text = ChrW(&H337F) & ChrW(&H336F) & ChrW(&H32AC) & ChrW(&H3240) & ChrW(&H3228) & ChrW(&H6C35) その他、平仮名/片仮名/ハングル等はどうするのか。また、漢字ではあっても、 日本以外の文字(中国、香港、台湾、韓国、ベトナム)をどうするのかといった点も 詰めておかなければならないでしょうね。 で、とりあえずは Unicode と仮定して…。 Unicode のコードポイントを調べて、それが“CJK 統合漢字”の範囲 すなわち U+4E00〜U+9FFF のブロックにあれば、漢字と見做してよいでしょう。 日中韓の殆どの漢字は、この領域にあるハズです。 なお、調べる文字がサロゲートペアで無ければ、 Dim S As String = AscW(文字).ToString("X4") にて、4桁の16進数を得ることができます。 その他、該当しそうな範囲を下記などから探してみてください。 http://www.asahi-net.or.jp/~AX2S-KMTN/ref/unicode/e_asia.html # ついでにネタとして、[漢字っぽくない文字]の例。 # 普段利用可能な文字では無いですし、今回の話とは関係無いですけれども。 # http://www.sf.airnet.ne.jp/~ts/language/coelacanth.html
←解決時は質問者本人がここをチェックしてください。
更新する
戻る
掲示板システム
Copyright 2021 Takeshi Okamoto All Rights Reserved.