こんにちは。暑くて外に出る気がしない四ツ屋です。
今日はSQLServerのデータ構造の基本をさらっとお伝えしますね。
夏なのでさらっと……
1.データベース
2.テーブル
3.カラム(列)
4.レコード(行)
5.フィールド
これだけ覚えておけばとりあえずは大丈夫です。
■データベース構造の中身について
1.データベースについて
アプリケーションソフトのデータを格納する「箱」のようなものです。
システムの構造によって、データベースの構造は変わります。
例えば、アプリケーションとデータベースは1:1には限りません。
たとえば、会社内で同一の商品マスタを複数の部署が参照し、その部署ごとに出荷管理システムが存在する場合、1つのアプリケーションで複数のデータベースを参照することもありますね。
複数のテーブルの集まりが「データベース」です。
2.テーブルについて
では、データベースの中身「テーブル」についてです。
データベースがエクセルファイル本体だとすると、テーブルとは表、ワークシートのようなものです。
テーブルはそれぞれ、格納する内容によって名前をつけ、その中身が分かるようになっています。
ひとつのテーブルに何でもかんでも入れればいいというわけではないので、データの種別ごとにテーブルが分けられるように設計されるのが通常です。
3.カラム(列)
テーブルの構造は設計・開発時に決められ、後から変更する場合には注意が必要です。
アプリケーションでデータの登録・更新をするなどの場合に、データベース側だけ変更がかかっていると、エラーになることがあるためです。
そのため、データベースのカラムを追加・削除したり、変更したりする場合には、アプリケーションの利用を止めることがあります。
カラムとは、テーブルの「列」のことです。
分かりやすく「住所録」で例えると、名前、住所、電話番号など、どの情報を格納するか、が決められています。
また、カラムごとに、どのようなデータの形式かを格納するかも決めます。
この形式のことを「データ型」といいます。
たとえばエクセルではセルごとにフォーマットを「文字列」や「数値」「日付」などを設定することができますが、SQLServerではカラムごとに決めています。
エクセルのようにセルごとにデータ型を変えることはできません。
4.レコード(行)
レコードとは、テーブルの「行」のことです。
テーブルという「表」において、カラムが列、レコードが行ですね。この概念が非常に重要です。
レコードは、アプリケーションの操作や、クエリによって新規登録、更新、削除を行うことができ、その場合、カラムとは異なり、追加・変更をする場合にも特にデータベースの構造が変わる訳ではありません。
(図)カラムとレコード、テーブルの説明図です。
5.フィールド
フィールドとは、上記の図でいうところの各セルを指します。
例えばデータベース上で一つのフィールドの値を特定するには、どのレコードのどのカラムか、ということがわかれば特定ができます。
フィールドに入る値は、カラムで設定した書式に基づいた値を格納しています。
■正規化とは?
先程、テーブルの説明で「何でもかんでも入れればいいというわけではない」と書きました。
例えば、サイトで会員登録したユーザー情報と、その会員のサイトでの購入履歴は同じテーブルに格納することは基本しません。
まったく用途が異なるものだからです。
そういった場合は、ユーザーのIDだけを、購入履歴側のテーブルに格納することによって、どのユーザーがいつ、何を購入しているのかが分かるようになります。
どこまで同じテーブルに入れ、どれを異なるテーブルに格納するかは、アプリケーションの設計によりますが、要は、効率よくデータベースを管理するか?ということにあります。
正規化は詳しくやるとものすごくめんどうくさいので、もっと教えろよ四ツ屋!という方は、こういうサイトをご覧頂くといいかなと思います。