メインのコンテンツ
現在の時間:0:00合計時間:8:18

ビデオのトランスクリプト

このビデオで私がしたい ことというのは, データを表現する いろいろな方法について 考えることです。 ここには,リストが 1 つあります。 これを 1 つのデータの 形式と考えてみましょう。 たとえば,これを生徒の前回 のテストの点としましょう。 エイミーは 90 点で, ビルが 95 点, カムは 100 点で, エフラも 100 点でした。 そしてファラーが 80 点でした。 これはデータを示す 一つの方法です。 思い出しましょう。データという のは単なる情報の記録です。 それは数値の時もあるし, 量のこともあります。 実際の点数を記録したり, または,彼らがテストが どれだけ好きだったかを 記録したデータかもしれません。 この数は,私はこれは 本当に好きだった, まあ好きだ,好きではないを 表しているかもしれません。 それは 0 から 5 までの スケールかもしれません。 その場合には数に なりますけれども, しかし,人の意見を 測っている数です。 ここでは,彼らの 実際の得点です。 すると,いろんな異なった 型のデータがあります。 私はその全てを見ていく つもりはありません。 でも,ちょっとこの データを表現する 異なった方法を 考えてみましょう。 あなたはこれを表として 見ることができるでしょう。 その時には,こう名前が あって,得点があります。 すると,名前の列があり, 得点の列があります。 私はこれを 1 つの表に このようにすることができます。 これは 1 つの方法です。 データを表す方法としては とてもよくある方法です。 こんな感じですね。 実は,多くの伝統的な データベースというのは データをこんなふうな表で 記録していました。 しかし,これをする他の 方法もあります。 あなたはこれを, 棒グラフとか, 時にはヒストグラムと 呼ばれるもので 記録することもできます。 得点をこちらの 垂直軸で示して,… こちら (この軸) が得点で, そして名前をこちらに 書くことができます。 では得点を見てみましょう。 ここを 50 点にしますか。 いや実際に,目盛りを 描いておきましょう。 これは 10, 20, …,これは ちょっと大きすぎです。 10, 20, 30, 40, 50, 60, 70, 80, 90, そして, ここが 100 です。 1, 2, 3, 4, 5, ここが 50 です。 それからそれぞれの人に ついて見ていきましょう。 エイミーは試験で 90 点でしたから 棒はこの 90 のところ まで行きます。 これがエイミーの点です。 そしてビルは 95 点でしたから, 90 と 100 の間です。 90 と 100 の間, ちょうどここでしょう。 ビルは 95 点です。 こんな感じです。 これがビルです。 それからカムですけれども, カムは試験で 100 点でした。 ちゃんとできるといいですが, 手書きなので コンピュータを使ってグラフを 作るほど正確にはできません。 ここにあるのはカムの得点です。 エフラはカムと同じ得点でした。 すると彼女の得点は どうなるかというと, エフラの色を使いましょう。 ここにあるのが エフラの得点です。 彼女も 100 点でした。 これがエフラです。エフラ。 最後にファラは, 80 点でした。 ここが 80 です。ここが 80 点。 ファラは 80 点をとりました。 これがファラの得点です。 これがデータを表現する もう一つの方法です。 こちらはより目に見える 形になっています。 しかしこれらの 2 つは 同じ情報です。 こちらでは名前を探して, 得点もわかります。 エイミーは 90 で,カムは 100 点, エフラも 100 点, そしてファラは 80 点 だとわかります。 そしてこの情報を取るもっと 他の方法もあります。 実は時には,この名前は わからないこともあります。 するとそれはより少ない 情報になります。 たとえば,得点の リストだけとかです。 教授が「これはこの試験を 受けた 5 人の得点だ」 と言うかもしれません。 こういうふうに, 90, 95, 100... 100,そして 80 です。 もしリストがあれば,これが あなたの全部のデータです。 これにはこちらの棒グラフや, このヒストグラムよりも 少ない情報しかありません。 というのもこちらでは, 得点だけではなくて, 誰がその点をとったかも わかるからです。 こちらは得点のリスト しかわかりません。 他にもデータを表現する 方法があります。 このビデオはデータを表現する 全部の異なる方法を 説明するものではないです。 ちょっとそれはできないです。 他にも,得点の頻度を見る データの表現と いうのもできます。 得点の頻度を見る 方法を見てみましょう。 人の名前の代わりに, 得点を書くことになります。 ここが 80 点, 85点, 90点, 95, そして 100 点です。 それから,これらの 得点をとった人の 頻度を書いていく ことになります。 80 点の人はどれだけいましたか? 80 点をとったのは ファラだけですから, 1 個のデータ点です。 だれも 85 点は 取っていません。 1 人が 90 点をとったので, ここに点を 1 個打ちます。 もう 1 人が 95 点でした。 それから 2 人の 人が 100 点でした。 ですからここに 2 個点 を置くのですけれども もう一つの 100 をこちらの 色にしてみましょう。 このように人に色を対応 させる必要はないのですが, ここではわかりやすいかと 思ってこうしてみました。 この軸は頻度の数です。 そしてここは,80 点の人が どれだけいるか 90 点の人が何人いるか。 100 点の人が何人いるかを 示しています。 するとここにあるものは, この数のリストと 同じデータです。 これは単にこのデータを見る もう一つの方法です。 そして一度データをどれかの 方法でまとめて見ると, いろんな情報がわかります。 たとえば,いろんな情報に ついて尋ねることができますが そうですね。データの値域, レンジは何でしょうか? データの値域というのは, データの一番低い値と一番 高い値の間の広がりです。 するとこのデータの値域は, 一番高いこの 100 点, そして一番低い 得点は 80 ですから 値域はこの差になります。 つまり最大値ひく最小値です。 するとそれは 100 ひく 80 ですから, 20 に等しいです。 これはこのデータが どんな広がりかの 感じの一つを与えてくれます。 他にも,100 点より下, 100 点未満の得点の 人は何人いますか? と 尋ねることができます。 これも興味ある質問です。 実は,どのデータの 表現方法を見ても これらの質問には 答えることができます。 もし,「100 点未満の人は 何人いますか?」と尋ねれば, この 3 人です。 「100 点未満の 人は何人いますか?」 1, 2, 3 人です。 こちらも 1, 2, 3 人です。 ここでも,1, 2, 3 人 とわかります。 すると,どの表現方法で みても 3 になります。 そしてまた,一番頻度の 高い得点は何ですか? と 聞くこともできます。 一番頻度が高いもの。 するとまた,この データを表現する これらのどの方法からでも この質問に答える ことができます。 最初の表をみると, 90 も 95 も 80 も 1 個で, 100 だけが 2 つありますから 一番頻度の高い のは 100 です。 こちらでも,2 つの 100 で, 残りは 1 つづつです。 ここでも 2 つの 100 があります。 そして頻度を見る時には, この図が一番はっきり するでしょう。 これは時々頻度プロット とも呼ばれます。 ドットプロットとも 呼ばれますが, 頻度プロットとも 呼ばれることがあります。 ここにあるように, 一番頻度の多いものは, 一番点がたくさん 並んだところです。 それは 100 です。 いずれにせよ,ここでは, 様々な異なる方法で どのようにデータを表現 することができるかの 概要をお見せしました。 しかしここで私は あなたに一つだけ しっかりわかって 欲しいことがあります。 それはここにはいくつも 違ったデータの 表現がありますが, 見ためは違っても 1 つの同じデータを表して いるということです。 そして多分これとは別の データを表現する方法を 発明することもできるでしょう。