◆当ページにはプロモーションが含まれています

お役立ち情報

文字コードってなんで存在するの? – 知ったかぶりしたいテクノロジー談義

文字コードについてお勉強しよう

みなさん、こんにちは。どんぶラッコです。

本日は、文字コードについて書きたいと思います。

UTF-8 や Shift-JIS など、きいたことがあるのでしょうか。

文字コードが合っていないと日本語が変になって表示されたりしてしまいます。

なので、character set を指定してあげる必要があります。

でもこれ、なんでこのようなことが起こってしまうのでしょうか?

前提: コンピュータは0と1で情報を表現する

そもそも、コンピュータは情報を0と1で処理していきます。

https://proglearn.com/2019/06/01/%e3%80%90%e6%80%9d%e8%80%83%e6%b3%95%e3%80%91%e3%80%8c%e4%ba%8c%e9%80%b2%e6%95%b0%e3%81%af%e3%81%aa%e3%82%93%e3%81%a70%e3%81%a81%e3%81%aa%e3%81%ae%ef%bc%9f%e3%80%8d%e5%b8%b8%e8%ad%98%e3%81%ab%e7%96%91/

電気信号だからですね。一番最初はケーブルをアナログにつなぎ変えることで0と1を表現していたそうです。

歴史を感じますね!

文字符号化

なので、文字も0と1に変換されて使われます。

ASCIIというルールで文字を分解した場合、このようになっています。

Hなら72, eなら101…といった具合ですね。

統一規格を作ったものの..

一番最初はコンピュータによってルールがバラバラでした。

そこで、符号化の方法を標準化しようという機運が高まります。

そこで生まれたのがASCIIです。

しかし、ASCIIには問題がありました。それは…

そう、アルファベットの表示しか想定していなかったのです。

だから日本語、ましてや漢字を256通りの中で表現するのは無理がありました。

そこで、複数バイトを使って文字を表現する手法が提言されました。

それが ISO-2022-JP, Shift-JIS, EUC-JP という規格なのです。

こうやって整理してみると面白いですよね♪

他にも調べてみましょう!

エンジニアにおすすめ転職サイト

マイナビIT AGENT
迷ったらまずはココ。求人数が多いため希望や条件にマッチする求人が見つかる!

レバテックキャリア
担当者のレベルが高い。エンジニア特化で15年の実績がある実績で初回提案での内定率驚異の90%!

JOIN
副業やフリーランスとして高額報酬案件を見つけるならJOIN。未経験者でも案件獲得実績豊富が強み!

\面白いと思ったら/

記事のシェア & Twitter のフォロー をお願いします!

@proglearn
一緒によく読まれている記事

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です