新着情報

読者の声

声を書き込む

名前


操作

掲示板に移動する

メールを送る

| →メールフォームから

よく使われる単位「バイト」ってなぁに?

 パソコンの話でよくでてくる単位のひとつに、「バイト」があります。「メガバイト」や「ギガバイト」といった言い方をすることもよくありますね。ここではこの「バイト」とはなにかを、わかりやすく解説します。

「ビット」と「バイト」を使って文字を表そう

 「デジタルの世界では、情報を0と1で表す」ということは、なんとな〜くご存知でしょうか。この、「ゼロなのかイチなのか」という、情報の最小単位を、「ビット」といいます。たとえば、「00101101」というように、8桁の情報があれば、これは8ビットの情報だ、というわけです。

0と1

 さて、これを使って、パソコンがどのように「文字」を表現するかをお話しします。実は、パソコンはあらかじめすべての文字の番号表を持っています。たとえば、

  • A = 00000001
  • B = 00000010
  • C = 00000011
  • D = 00000100
  • E = 00000101

などなど、という具合に。ここでポイントとなるのは、これらの文字がすべて8桁のゼロイチ、つまり8ビットで表されているということです。これによってパソコンは、8桁ごとに情報を区切って解釈していけば、どんな文章でも組み立てられるわけです。

 この「8桁区切りの法則」によって生まれた新たな単位が、最初にお話しした「バイト」です。すなわち、「ゼロかイチか」という情報の最小単位だった「1ビット」を、8つ集めて「1バイト」と表すことに決めたのです。

  • 1バイト = 8ビット

 こうすることで、「この文章は、500バイトのデータだよ」といえば、すぐに500文字分のデータだということがわかりますね。


1バイトで表せる言語と、2バイトで表さなければならない言語

 ところで、もともとパソコンが生まれたアメリカでは、英語の大文字と小文字、それに少々の記号だけですべての文章を表現できますが、日本語などはそうはいきません。実は、1バイトで表現できる文字の種類は、どうがんばっても2の8乗=256通りしかないのです。そこで、日本語や中国語など、たくさんの文字を必要とする言語では、1文字を2バイト(16ビット)で表現することにしました。これで、表現できる文字は6万5536通りになり、たくさんの漢字も表現できます。

 ちなみに、一般的な日本のパソコンでは、1バイトで表した文字は半角文字、2バイトで表した文字は全角文字といいます。パソコンの画面上では、ふつうは全角文字のほうが少しだけ幅が広いですね。

文字化け

 また、英語などの、全角文字なんて扱わない言語では、全角文字で打った文字は解釈できず、文字化け(意味不明な文字の羅列)してしまいます。また、全角文字を使う言語同士でも、それぞれの文字に割り当てられる「ゼロイチの組み合わせ番号表」が違うので、やはり文字化けしてしまいます。ただし、パソコンの中に「中国語版のゼロイチの組み合わせ番号表」さえあれば中国語も表示できます。また、「2バイトで表現できる6万5536通りを上手に使って、ひとつの組み合わせ番号表で世界の文字を表現しよう」という活動もありますが、うまくいっていません。


画像も表現してみよう

 さて、パソコンが扱うデータは、もちろん文字だけではありません。たとえば、画像のデータは次のように表します。

画素の拡大

 パソコンで扱う画像というものは、細かく細かく見てみると、多数の小さなマス目の集合で構成されているのがわかります。たとえばふつうのテレビも、よく見れば「赤緑青」でできたマス目がたくさん並んでいますよね。こうした小さなマス目に、ひとつひとつ色の情報を割り当ててやれば、大きな画像のできあがりです。たとえば、

  • 白 = 111111111111111111111111
  • 黒 = 000000000000000000000000
  • 赤 = 111111110000000000000000
  • 緑 = 000000001111111100000000
  • 青 = 000000000000000011111111

などなど、という具合に。

 ずいぶん桁数が多いと感じますか?それもそのはず。文字と違って、色というものはどこまでも微妙な表現が可能で、「少しだけ黄色の入った赤を基調に、あまり鮮やかではなくぼんやりと白みがかっている感じ」などと追求していけばいくら色数があっても足りません。そんなわけで現在は、色を24桁(24ビット)で表すことが多いのですが、色数をそんなに必要としない場合は、16桁や8桁などで色を表現することもあります。

 ところで、これだけの桁(ビット)を使って、いったいどれくらいの数の色を表現できるのかというと、24ビットでは2の24乗でおよそ1677万色、16ビットでは6万5536色、8ビットでは256色となります。ひょっとしたら、ケータイ電話の液晶画面をPRするCMなどで、おなじみの数字かもしれませんね。

 さて、大きな画像を表現するためには、この24ビットで表現された色を、「多数の小さなマス目」に割り当てていかなければなりません。たとえば200万画素のデジカメで撮った写真は、200万個の小さなマス目で構成されています。(そう、デジカメの「画素」とは、小さなマス目の数のことなのです!)

 計算してみましょう。200万個のマス目それぞれに、24ビット分の色の情報を割り振ると…200万 x 24 = 4800万ビット。先ほど文字のときにお話しした「バイト」という単位を使えば、8ビット = 1バイトなので、600万バイトという計算になります。


より大きな情報量――「メガバイト」や「ギガバイト」

 画像の例からもわかるように、パソコンで扱う情報は、非常に大きなデータ量になります。そのため、コンピュータの世界では、1024バイト(8192ビット)をまとめて、「1キロバイト」ということにしました。1024という数字は、2の10乗ですから、ゼロとイチの二進法で情報を表現するパソコンにとっても扱いやすいのです。

 都合のよいことに、この「キロバイト」という表現は、わたしたちが日常使っているキロメートル、キログラムなどの「キロ」とほぼ同じ倍数を表しているため、感覚をつかみやすいという利点もあります。

  • 1キロメートル = 1000メートル
  • 1キロバイト = 1024バイト

ですから、「この論文は、10キロバイトのデータだよ」といえば、だいたい1万文字くらいの論文だということが、すぐにわかるわけです。

 同様に、1024キロバイトをまとめて1メガバイト、1024メガバイトをまとめて1ギガバイトというように、1024倍ごとにどんどん単位を大きくできます。

  • 1バイト = 8ビット
  • 1キロバイト = 1024バイト
  • 1メガバイト = 1024キロバイト = 104万8576バイト
  • 1ギガバイト = 1024メガバイト = 104万8576キロバイト = 10億7374万1824バイト

 メガやギガはあまり聞き慣れないかもしれませんが、発電所の発電能力を○○メガワットなどといいますね。1メガワットは100万ワットになります。この便利な単位を使えば、先ほどの200万画素のデジカメ画像も、およそ6メガバイト、とスッキリ表すことができます。

青空

 ただし、実はデジカメの写真などのデータは、圧縮技術が使われているので、200万画素の画像も、実際には1メガバイト未満のデータになっています。なぜ圧縮できるのかというと、たとえば青空の写真なら、いちいち各マス目に「青青青青…」と指定していかなくても、「青ばっかり」といったおおざっぱな情報で十分な場合が多いからです。(まあ青空は極端ですが、どんな写真も、細かく細かく見れば、同じような色が固まっていたりするものです)


あなたもきょうから「バイト」がわかる

 さあ、「バイト」という単位が理解できたでしょうか。実際には、カタカナではなく、次のような表記が多く使われています。

  • 1byte (1バイト)
  • 1KB (1キロバイト)
  • 1MB (1メガバイト)
  • 1GB (1ギガバイト)

 あなたのデジカメに入っているメモリーカードにも、○MBといった容量が書かれているはずです。128MBなら、1メガバイトの写真を128枚撮れるわけですね。あなたのパソコンのハードディスクにも、○GBといった記録可能容量があります。100GBなら、1メガバイトの写真をどのくらい記録できるでしょうか?(1GBは、およそ1000MBですね)

 最後に、日進月歩のパソコンの業界ですから、もっと大きな単位も紹介しておきましょう。ギガバイトのあとには、次のような単位が続きます。

  • 1TB (1テラバイト)
  • 1PB (1ペタバイト)
  • 1EB (1エクサバイト)



Copyright © 2003 Yokota Kounosuke (). All rights reserved.
表紙 | このサイトについてのご案内