>> Java入門トップに戻る

文字コードを変換してファイル読み込み

Javaで文字コードを変換してファイルを読み込む方法を説明します。

Javaは内部的に文字エンコーディングとしてUTF-16を利用しているため、読み込むファイルの文字コードが別の文字コードだと読み込んだ時に文字化けしてしまいます。
なので変換して読み込んでやる必要があります。

私が知ってる方法としては2つあります。

InputStreamReaderを使う

一つ目の方法は「InputStreamReaderクラス」を使う方法です。
以下のコードを見てください。
package file;

import java.io.BufferedReader;
import java.io.FileInputStream;
import java.io.InputStreamReader;

public class FileTest{
	
	public static void main(String[] args){
		
		FileInputStream fi = null;
		InputStreamReader is = null;
		BufferedReader br = null;
		
		try {
			//インスタンス生成
			fi = new FileInputStream("SHIFT_JIS.txt");
			is = new InputStreamReader(fi,"SHIFT_JIS");
			br = new BufferedReader(is);
			
			String tmp;
			
			//1行ずつ読み込み
			while((tmp=br.readLine())!=null){
				
				System.out.println(tmp);
				
				
			}
		
		} catch (Exception e){
			e.printStackTrace();
		}finally{
			
			try {
				br.close();
			} catch (Exception e) {
				e.printStackTrace();
			}
			
		}
	}
	
}
インスタンス生成部分を見てください。
	//インスタンス生成
	fi = new FileInputStream("SHIFT_JIS.txt");
	is = new InputStreamReader(fi,"SHIFT_JIS");
	br = new BufferedReader(is);
まず、FileInputStreamのコンストラクタの引数にファイル名を指定してFileInputStreamインスタンスを生成します。
次に「InputStreamReaderクラス」のコンストラクタの第1引数にFileInputStreamのインスタンスを、第2引数に「読み込むファイルの文字コード」を指定します。
上記の例では文字コードがSHIFT_JISのファイルなので「SHIFT_JIS」と書いていますが、UTF-8なら「UTF-8」等と指定します。
表記としては「SJIS」や「utf8」みたいに幾つか色々な表記が可能なようですので、そちらはググッて調べてください。

最後にこのInputStreamReaderクラスのインスタンスをBufferedReaderクラスのコンストラクタの引数に指定し、BufferedReaderのインスタンスを生成します。
このようにInputStreamReaderで橋渡しすることによって、SHIFT_JISのファイルをJavaの内部文字コードのUTF-16に変換しながら読み込んでくれるというわけです。

次に実際の読み込み部分です。
	//1行ずつ読み込み
	while((tmp=br.readLine())!=null){
				
		System.out.println(tmp);
				
				
	}
後は普通のテキストファイルの読み込みと同じですね。
文字コードを変換しながら読み込んでくれてるので、「readLineメソッド」で1行ずつ読み込むだけです。
null」を返すとファイルの末尾まで読み込んだことになるのでその時にループを拔ける仕組みです。

以上が「InputStreamReaderクラス」を使った文字コードの変換&読み込みの方法でした。

ByteArrayOutputStreamやStringクラスのコンストラクタを利用して文字コード変換

もう一つの文字コードを変換して読み込む方法です。
ByteArrayOutputStreamクラス」や「Stringクラスのコンストラクタ」を利用する方法です。
以下のコードを見てください。
package file;

import java.io.BufferedInputStream;
import java.io.ByteArrayOutputStream;
import java.io.FileInputStream;

public class FileTest{
	
	public static void main(String[] args){
		
		FileInputStream fi = null;
		BufferedInputStream bi = null;
		ByteArrayOutputStream bos = null;
		
		try {
			//インスタンス生成
			fi = new FileInputStream("SHIFT_JIS.txt");
			bi = new BufferedInputStream(fi);
			bos = new ByteArrayOutputStream();
	
			int tmp;
			
			//1バイトずつ読み込み
			while((tmp=bi.read())!=-1){
				
				//読み込んだデータをバイト配列に溜める。
				bos.write(tmp);
				
			}
			
			//ByteArrayOutputStreamのtoStringメソッドで変換
			String test = bos.toString("SHIFT_JIS");
			
			//表示
			System.out.println(test);
			
			
			//ここからはStringクラスのコンストラクタを利用した方法
			//バイト配列を書き出し
			byte bytetmp[] = bos.toByteArray();
			
			//Stringクラスのコンストラクタを利用して文字コード変換
			String test2 = new String(bytetmp,"SHIFT_JIS");
			
			//表示
			System.out.println(test2);
			
			
			
		
		} catch (Exception e){
			e.printStackTrace();
		}finally{
			
			try {
				bi.close();
				bos.close();
			} catch (Exception e) {
				e.printStackTrace();
			}
			
		}
	}
	
}
インスタンス生成部分です。
	//インスタンス生成
	fi = new FileInputStream("SHIFT_JIS.txt");
	bi = new BufferedInputStream(fi);
	bos = new ByteArrayOutputStream();
ファイル自体はBufferedInputStreamでバイナリデータとして読み込むため、BufferedInputStreamのインスタンスを生成しておきます。
また、「ByteArrayOutputStreamクラス」というクラスのインスタンスも生成しておきます。
これはバイト配列に書き込まれるバイト配列出力ストリームを作成してくれます。
要は読み込んだデータを「byte型の配列として」バッファを自動的に拡張しながら保持してくれるクラスです。
このバイト配列出力ストリームに書き込まれたデータは「byte型の配列として」後で取り出すことが出来ます。

データ読み込み部分です。
	//1バイトずつ読み込み
	while((tmp=bi.read())!=-1){
				
		//読み込んだデータをバイト配列出力ストリームに書き込む。
		bos.write(tmp);
				
	}
データを1バイトずつ読み込んで、その読みこんだデータをバイト配列出力ストリームに書き込んでいます。
ByteArrayOutputStreamには「writeメソッド」が用意されており、このメソッドを使うことでバイト配列出力ストリームに書き込むことが出来ます。
イメージとしては配列をちょっとずつ拡張しながら読み込んだデータを配列に入れていくイメージです。

次に文字コード変換部分です。
	//ByteArrayOutputStreamのtoStringメソッドで変換
	String test = bos.toString("SHIFT_JIS");
			
	//表示
	System.out.println(test);
ByteArrayOutputStreamには「toStringメソッド」が用意されており、この引数に「読み込んだファイルの文字コード」を指定します。
このメソッドを実行することで、Javaの内部文字コードであるUTF-16に変換してString型の文字列を取得できるというわけです。

また、さらに下のコードには「Stringクラスのコンストラクタ」を利用して文字コードを変換する方法も記載しています。
	//ここからはStringクラスのコンストラクタを利用した方法
	//バイト配列を書き出し
	byte bytetmp[] = bos.toByteArray();
			
	//Stringクラスのコンストラクタを利用して文字コード変換
	String test2 = new String(bytetmp,"SHIFT_JIS");
			
	//表示
	System.out.println(test2);
まず、ByteArrayOutputStreamの「toByteArrayメソッド」を使って、バイト配列出力ストリームに書き込まれたデータを「byte型の配列」として取り出しています。
その後、このbyte配列を「Stringクラスのコンストラクタ」の第一引数に指定し、第二引数に「読み込んだファイルの文字コード」指定しています。
このようにStringクラスのコンストラクタを実行してインスタンスを生成することで、文字コードを変換して文字列を取得することもできます。

以上、読み込んだデータの文字コードを変換する方法を説明しました。


>> 【文字コードを変換してファイル書き込み】に進む
>> Java入門トップに戻る
●更新履歴
2016/08/16 Java入門ページにページを幾つか追加
2016/04/08 Java入門ページ作成
2016/03/09 メニューレイアウト変更。ブラウザキャッシュのクリアをお願い致します。
2016/03/09 PDOトランザクション、自動コミットモードをオフ追加
2016/03/09 PDO 例外処理 try catch追加
2016/03/09 PDO update文実行追加
2016/03/09 PDO delete文実行追加
2016/03/09 PDO insert文実行追加
2016/03/09 PDO selectでデータを取得、fetchAll、queryメソッド追加
2016/03/09 PDO bindValueとbindParamの違い追加
2016/03/09 PDO prepare プリペアドステートメントの使い方追加
2016/03/04 ソースコードをクリップボードにコピーする機能を追加
2016/03/04 C言語、C++のページのソースコードを一部修正
2014/01/31 C言語関数一覧ページに11ページほど追加
2014/01/31 C言語関数一覧ページに30ページほど追加
2014/01/30 C言語関数一覧ページ作成中
2013/07/01 レイアウト変更に伴いブラウザキャッシュのクリアをお願いします。
2013/07/01 MySQL入門ページ作成
2013/07/01 PHP入門ページにSQLite学習項目追加
2013/06/25 ドメイン変更、レイアウトを一部変更
2013/03/14 レイアウトを一部変更
2012/08/13 C言語よくある課題・宿題ページ開設!
2012/08/13 シューティングゲーム作成第33章追加!
2012/08/11 ドメイン変更&サーバ移設完了
2012/04/21 シューティングゲームプログラミング第2,3章の内容を修正
2012/04/19 シューティングゲームプログラミング第2章の内容を修正
2012/04/03 Googleカスタム検索を設置!
2012/04/03 シューティングゲームプログラミング第32章追加!
2012/04/03 シューティングゲームプログラミング第31章追加!
2012/03/31 サイトをリニューアルしました!
2012/03/25 シューティングゲームプログラミング第30章追加!
2012/03/19 シューティングゲームプログラミング第29章追加!
2012/03/16 シューティングゲームプログラミング第28章追加!
2012/02/27 シューティングゲームプログラミング第27章追加!
2012/02/03 シューティングゲームプログラミング第26章追加!
2012/01/31 シューティングゲームプログラミング第25章追加!
2012/01/20 シューティングゲームプログラミング第23,24章追加!
2012/01/11 シューティングゲームプログラミング第22章追加!
2012/01/05 トップページ、ゲームプログラミング関連のトップページのデザインを変更
2012/01/04 シューティングゲームプログラミング第21章追加!
2012/01/01 シューティングゲームプログラミング第20章追加!
2011/12/25 シューティングゲームプログラミング第19章追加!
2011/12/22 シューティングゲームプログラミング第18章追加!
2011/12/18 シューティングゲームプログラミング第17章追加!
2011/12/17 シューティングゲームプログラミングページOPEN!
2011/11/21 ゲームプログラミングページOPEN!
2011/11/21 サイトデザインを大幅に変更
2011/11/17 TOPページのデザインを変更。相互リンクページに、複数サイト追加。
2011/11/06 WINAPI学習ページ(33~36章)追加
2011/11/05 WINAPI学習ページ(20~32章)追加
2011/10/27 WINAPI学習ページ(14~19章)追加
2011/10/21 WINAPI学習ページ(13章)追加
2011/10/21 サイトマップ、連絡ページ追加
2011/10/17 WINAPI学習ページ(6~11章)追加
2011/10/16 WINAPI学習ページ(1~5章)追加
2011/10/13 全体のレイアウト変更
2011/10/07 PHP学習ページ(8~11章)追加
2011/10/06 PHP学習ページ(1~7章)作成
2011/10/06 JavaScriptリファレンスページ作成
2011/10/05 C言語学習ページ発展編(10~14章)追加
2011/10/04 C言語学習ページ発展編(1~9章)追加。
2011/10/03 HTML/CSSリファレンスのページ追加。(個々の詳細ページは作成中)
2011/09/30 HTML学習ページ(8章)追加
2011/09/29 JavaScript学習ページ(12~17章)追加
2011/09/28 JavaScript学習ページ(1~11章)追加
2011/09/27 HTML学習ページ(4~7章)追加
2011/09/26 C言語学習ページ(27章)追加、C++学習ページ(17章)、HTML学習ページ(1~3章)追加
2011/09/25 C言語学習ページ(23~26章)を追加
2011/09/24 C++学習ページ(9~16章)追加
2011/09/23 C++学習ページ(3~8章)追加
2011/09/22 C言語の学習ページ(22章)とC++学習ページ(1~2章)追加
2011/09/21 C言語の学習ページ(15章~21章)を追加
2011/09/20 C言語の学習ページ(10章~14章)を追加
2011/09/19 サイト作成(随時更新予定)