働く女性のためのITお役立ち情報

Excel不要!CSVの文字化けをカンタンに直す方法

  • LINEで送る

✔ クレジットカードの利用明細をWebサイトからダウンロードして
ファイルを開いたら文字化けしていた

✔ メルマガやECサイトからデータをダウンロードして
ファイルを開いたら文字化けしていた

ということありませんか?

 

今後ますますペーパーレス化が進み、Web上でデータを確認する機会が増えてきます。
Web上のデータを自分で加工して利用する機会も増えてきます。

その時によく使われるのがCSVです。

ダウンロードしたCSVファイルを別のアプリケーションで使おうと思ったとき
文字化けして慌ててない
ために、カンタンに直す方法をご紹介します!

 

今回の記事は次のような方のお役に立てます

なんとなくCSVファイルを使っている方

一度でも、CSVファイルを開いて文字化けを経験した方

CSVファイルの文字化けをExcelを使って修正している方

 

今さら聞けない、「CSVとは」

CSVとは
「Comma Separated Value(=カンマ(,)で区切った値)」
の頭文字をとって名付けられた

カンマ区切りのテキストのことです。

 

 

Excelと関連付けられて、パソコンで開くと、Excelが立ち上がって開かれることが多いですが、
Excelのファイルとは別物です。

Macの場合は、Numbersが立ち上がって開かれることが多いです。

ExcelやNumbersで開くことが多いCSVファイルですが、
実は、CSVファイルは
Excelがなくても、メモ帳で開くことができます。

また、CSVファイルはExcelで作成されたファイルよりもサイズが小さいので、
メールでやりとりしやすかったり、異なるアプリ間でデータのやり取りができます。

 

文字化けが起こる原因

なぜ、文字化けが起こるのでしょうか?

文字化けが起こる原因の一つに、文字コードの違いがあります。

文字コードの違いは、

  • アプリケーションがどの文字コードに対応させてつくられているか
  • どのOS(WindowsやUnix、Linux、iOSなど)で動作するのか

などで決まります。

文字コードにはいくつか種類があります。

カード明細を表示するWebサイトの文字コードとパソコンの文字コードが違うと
WebサイトからダウンロードしたCSVをパソコンで開くと文字化けしている!
ということが起きてしまいます。

 

主な文字コード

JIS(ジス)

日本工業規格(JIS)により定められたコードです。
インターネットや電子メールで日本語を表記する際に、最も標準的に使用されます。

Shift-JIS(シフトジス、エスジス)

Microsoft社により定められたコードです。
WindowsやMS-DOS、Macで使われています。

 

おだゆきえ
おだゆきえ
日本語で表示されるときは、
JISかShift-JIS
が多いです

 

ASCII(アスキー)

アメリカ規格協会(ANSI)が制定した文字コードです。
ASCIIはAmerican Standard Code for Information Interchangeの略
国際標準化機構(ISO)により国際標準で、
ラテンアルファベット、数字、記号、空白文字、制御文字などの128文字を表現されています。

 

おだゆきえ
おだゆきえ
余談ですが、
規格協会と言えば、日本はJIS、アメリカはANSIってことですね

 

Unicode(ユニコード)

コンピュータに適していない文字コードを使用すると、いわゆる文字化けを起こしてしまいます。
これを回避するために、
文字を4バイトで表現し、アルファベット、漢字、カナ、アラビア文字など世界中の文字を表現したものが
『Unicode』です。

UTF-8(ユーティーエフエイト)

世界的にも最もポピュラーな文字コードです。
Unicode用の符号化方式の1つで、
ASCIIで定義している文字を、Unicodeでそのまま使用することを目的として作られました。

 

他にも文字コードはありますが、
ここに上げただけでも5種類の文字コードがあるので
環境によって文字化けが起こる確率って案外高いんだなと、気付きになればと思います。

 

文字化けを直す方法

文字化けってどういうことか?

文字化けがどういうことかイメージが湧かない方は、
コチラの例をご覧ください。

B列が謎の文字になっています。
これが『文字化け』です。

この例は、

CSVの文字コードがUTF-8になっていて
CSVファイルをダブルクリックすると、Excelが立ち上がってファイルが開いた

状態です。

 

文字化けを直す

つまり
CSVの文字コードを変更する

方法として
よく紹介されているのが
Excelを使って文字化けを直す方法
ですが、
私は一度もその方法を使ったことがありません。

操作手順が多いし、チェックを入れる項目も多いし、
面倒くさいからです。

具体的には
Excelの「テキストファイル」から

テキストファイルウィザードを使って変更する

方法です。

操作手順が多く、チェック項目もあり、
「判断する」ことが多くて、気をつかうので、
私はこの方法は使いません。

代わりに、
もっと簡単にできる方法をご紹介しますね!

 

Excelを使わずに、CSVの文字化けを直すカンタンな方法

操作はたったの4手順です!

1.CSVファイルを選択して、右クリックで「メモ帳」を選択

CSVファイルがメモ帳で開かれます

2.[ファイル][名前を付けて保存]

3.文字コードを変更

UTF-8から

ANSIに変更

4.「保存ボタン」をクリック

上書き保存の確認メッセージが表示されたら、「はい」をクリック

 

おだゆきえ
おだゆきえ
これで
文字コードがUTF-8からANSIに変わりました!

 

Excelで開いても、B列が正しく表示されています!

 

まとめ

文字コードにはいくつも種類があり
動作環境(アプリやパソコンなど)によって文字コードが変わること
動作環境の違いなどが原因で文字化けが起こるということ
を知っていれば、

CSVにダウンロードして、Excelで加工しようとしたときなど
Excelで開いた時に文字化けしていいて慌てることなく
文字コードを変更して直すことができます。

 

もしも、文字化けに遭遇したら
慌てずに、
「メモ帳」で開いて、
文字コードを変更して「名前を付けて保存」してくださいね。

 

 

おだゆきえ
おだゆきえ
プログラマーは文字コードに悩まされ続けてることが多いので
「あ。これね」と日常茶飯事で対応してます♡