文字コード調査

windows-31jとshift_jisの違い

http://una.soragoto.net/topics/13.html
https://weblabo.oscasierra.net/shift_jis-windows31j/

utf8の判断の仕方

UTF-8のBOM付き・BOM無しの違いと確認方法

具体的には
/**
* ファイルはUTF-8ファイルかどうかを判定する
*
* @param file 読入ファイル
* @return 判定結果「true:UTF-8;false:以外」
*/
public static boolean encoding(File file) throws IOException {

InputStream in = new FileInputStream(file);
byte[] bt = new byte[3];
in.read(bt);
in.close();

if (bt[0] == -17 && bt[1] == -69 && bt[2] == -65) {
return true;
} else {
return false;
}
}

s-jisの文字コード
https://seiai.ed.jp/sys/text/java/shiftjis_table.html

タブ文字の削除
https://hydrocul.github.io/wiki/commands/tr.html
https://codenote.net/linux/3219.html

JavaのStringは文字数
https://www.javadrive.jp/start/string_class/index1.html

【linuxコマンド】nkfで文字コードを置換