2019年08月30日

文字コード変換で四苦八苦してタノシー

Java入門書の例題を出版社からDLして、そしたらshift-jisだったので漢字変換とかいうツールで一気にutf-8に変換した。その後にVScodeでJavaのお勉強・・・・の時に、あれっ? と気づいた。
utf-8に変換したはずなのにshift-jisと表示されているぞ・・・。
うーーむ。秀丸で開いて文字コード見たらshift-jisになっている!! utf-8に変換したはずなのにぃ。

うーむ。ここはPythonの学習も兼ねてコード変換の自作ツールでも作るか。shift-jisで読んでから別ファイルにutf-8で書き出せばいいんだろ。
という事で四苦八苦して作った。指定のフォルダーの下にサブフォルダーがあるので、そこらの処理も。
import os
import libpath

とかも、pathの最下層取得やら、その下のファイル名を取得やら。

四苦八苦して、できた!!    で、10ぐらいのFolderの下に合計50ぐらいのjava source fileがあって。秀丸で読んで文字コード確認したら、あららら、変換してないなあ。shift-jisのままやないかーぃ。どっひー。昔、知り合いに土肥さんという人がいたなあ(笑)

というわけです。そしてオレは気づいた。コード変換できているファイルとできていないファイルの違いはなにか?   そう、日本語が入っているファイルは正しく変換されてutf-8になっている。ところが日本語がないファイルはshift-jisのままだ。なんで変換しないのかーーーい。

そう。英記号だけならばshift-jisファイルとutf-8ファイルは同じなのであーーる。どうだ、そこに気づくまでに半日も費やしたぞ。おかげでPythonでのファイル処理に少し詳しくなったけどな。

別問題。VScodeでjavacを使うと日本語がコメントにある場合にエラーだ。コンパイルしやがらない。java 8だと思うけど。
> javac –encoding utf-8 hagahage.java   のように指定するとコンパイルする。VScode Editorはutf-8で使うのが常だ。てへ。

件の漢字変換とかいうツールも正常だったのだよ、ちみぃ!!   くそ、オレのバカぁ

posted by toinohni at 11:23| 東京 ☁| Comment(0) | ソフト系雑学 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
コチラをクリックしてください