一般社団法人 全国個人事業主支援協会

COLUMN コラム

ファイル読み込み時などで文字化けが発生した時の検出方法について
例えばUTF-8エンコードされたテキストファイルをShift-JISで読み込もうとした際に、該当する文字が存在しない場合は’0xFFFD’の文字に変換されます。
Javaは内部的にはUnicode(正確にはUTF-16らしい)実際Stringクラスのコメントを確認してみると”represents a string in the UTF-16 format in which supplementary characters”のコメントが確認できるので内部的にはUTF-16が使われているような感じです。(jdk1.8.0_73で確認)

The following two tabs change content below.

尹 淼

最新記事 by 尹 淼 (全て見る)

  • 2401 - 2024年1月25日
  • 12月 - 2023年12月22日
  • 11月 - 2023年11月27日

この記事をシェアする

  • Twitterでシェア
  • Facebookでシェア
  • LINEでシェア