集めたデータの集計方法(エクセルシートを活用する) 更新:2009/2/14
戻る

ankstat(アンクスタット)は集計を目的にした、エクセルシートである。
処理の制限(最新版ankstat5.xls)
入力可能量: 500ケース×200項目
基礎統計量の算出
度数集計: 1枚の選択肢は1〜20番まで
多重集計: 選択肢は1〜20

研究室サイトにあるankstat5.xls(エクセルシート)を開く
このシートをオフラインで使用する場合,ファイル,名前を付けて保存により保存する
縦方向をケース,横方向を項目としてデータを入力する(ケース×項目=素データ行列)

入力データの例(赤文字を入力する, 20×5

A

B

C

D

E

F

1

2

3

4

5

1

8

4

5

5

3

2

9

6

9

3

8

3

9

5

5

7

4

8

3

6

6

5

7

9

1

4

8

6

2

4

9

7

5

2

4

2

4

8

5

1

2

9

3

2

1

7

9

10

5

4

8

1

11

1

9

6

7

12

7

1

3

4

1

13

5

8

8

5

1

14

2

7

7

5

6

15

6

1

7

16

9

3

6

3

9

17

6

3

18

8

5

1

5

9

19

2

6

3

2

2

20

1

9

1

1

(この例では 20人分5項目のデータの例である)

空白のセルは,欠測値を示す.空白セルはゼロではない.DELキーで値を削除する
入力後必要があれば保存する
ファイル,名前を付けて保存 で 好きなところに保存する
統計表タブを押せば,基礎統計表の結果が項目ごとに表示される.

項目番号

5

有効件数

17

最小値

1

最大値

9

平均

5.706

中央値

7.000

標準偏差

3.057

変動係数

53.58%

(第5項目の基礎統計量)

統計表利用のチェックポイント
すべての尺度に共通した作業
統計表は, 最小,最大値により入力データの範囲チェックを必ず行う.

名義,順序,間隔尺度の場合
平均と中央値が大きく離れている場合,分布が偏っている可能性がある
(賃金分布の場合,わずかな高所得者が平均賃金を押し上げてしまっているかも知れない).
標準偏差はバラツキ程度を表す指標.
しかし,そのままではわかりにくいので,平均で割った変動係数で評価する.
異なる項目(例えば単位が異なるなど)の場合でも変動係数で比較するとどちらの項目がバラツいているかを比較できる.

バラツキの考え方

△ 範囲(=最大値−最小値)の大きいものほどバラツいていると判断
変動係数の大きい=バラツキ大きい

度数表の見方・考え方

 名義や順序尺度の場合,統計表は目安にしかならない.むしろ度数表で内訳数や構成比を算出する.

度数

選択肢

1

1

1

1

6.25%

2

3

18.75%

3

1

6.25%

4

5

3

18.75%

6

1

6.25%

7

2

12.50%

8

3

18.75%

9

2

12.50%

10

(中略)

18

19

20

合計

16

(第1項目の度数表結果,度数と構成比%)
この度数表集計では,選択肢1から 20までについて集計する.それ以上大きな選択肢は無視される.
全部で 50項目について度数を数える.
表の下半分には,有効回答数を 100%とした構成比(%)に換算した表がある(上例では右列).
度数表などからグラフを描く
 このシートは原則保護されて変更できない.グラフ用度数表のシートで描くと便利だろう.

多重回答用度数表
全回答数を入力しておく(回答数基準の%を算出するため)
合成したい度数表の項目番号を指定する。指定方法は開始項目番号と終了項目番号の2つ
この範囲の項目は同一選択肢を持つ多重回答項目として集計される。
選択肢は1〜20まで