【講義概要】
本講義は、データ分析の基本的な手法を修得することがテーマです。情報リテラシー(パソコンの基礎操作)から、統計分析の入門的手法を学びます。専門科目でのデータ処理や統計分析のみならず、将来、仕事上でさまざまなデータを処理する際に最低限必要となる知識・技能も身につけます。
そこで、基本統計量から回帰分析までを取り扱います。具体的な学習内容としては、前半に基本統計量、後半で最小2乗法(OLS, Ordinary Least Squares)を学びます。
前半で、統計学入門の復習を含めて、データの簡単な統計的処理(基本統計量)を学習します。データの整理(度数分布表)からデータの特徴を捉えるための統計量(平均や標準偏差)を実際に計算しながらその意味を理解します。そして、1変数だけでなく、2変数の関係を捉える手法(共分散・相関係数)を学習します。
後半は、基本的な推定法としての最小2乗法を学びます。まず、中心を通る直線を決定するために残差の概念を学習し、残差の計算を行います。自分で回帰分析用ワークシートを作成しながら推定の原理を学びます。データと直線の当てはまり具合を検証する指標として、決定係数を取り上げます。
いくつもの例題データを用意し、実際にパソコンで計算しながら、得られた統計値の意味を学習します。また、受講生が講義における到達度を確認できるよう、ルーブリックを使います。
この授業は、経済学部のディプロマ・ポリシー【知識・技能】のうち「経済学の基礎的専門知識や分析ツールを使いこなす力」を養うことを主な目的としています。この授業に関連する資格として、IT パスポート試験を推奨します。
【学習到達目標】
学部で示されたディプロマ・ポリシーのうち、統計とデータ処理に関する分野の達成を目指します。社会人としてデスクワークに困らないスキルも身につけます。(詳細は、ルーブリックを参照してください。)
1. 統計学入門の知識を確実に理解できる。
2. 授業の例題をExcelで処理できる。
3. 独力で簡単な統計処理ができる。
4. 他人にExcelでの統計操作を教えることができる。
【履修上の注意】
この授業は、以下の3科目(必須および指定科目)が修了していることを前提として進めます。
(以下の1、2にあるインストラクターによる少人数の実習科目とは異なります。)
1. 情報処理基礎、情報リテラシー: 学習したPC操作内容
2. データ表現技法: Excelでのグラフ描画スキル
3. 統計学入門: 基本統計量の計算方法
また、反転授業なので、毎回、予習をした上で授業に臨んでください。(予習が不十分な場合、失格となります)
授業時間には、予習課題の解説や演習問題・確認テストを行います。
【事前準備学習】
履修前
・「データ表現技法」でのグラフ描画技術と「統計学入門」の内容を復習。ノートパソコンの動作確認
受講前
・授業教材(解説ビデオ・PDFテキスト・自学自習)から学修範囲と課題を連絡します。
・授業前日までに課題(MinutePaperの提出、自学自習の全問クリアなど)を提出します。
受講後
・授業での演習問題をMinutePaperに回答(授業後30分以内)
【教材】
※指定図書は担当教員が、学生が必読すべきものとして指定する図書のことです。
図書は図書館に置いてあり、1週間借りることができます。(一部貸出不可の図書もあります。)
教科書 | 『経済データ分析(PDF版)』 児島完二 PDF 2024 CCSの教材BOXからPDFファイル「テキスト」の最新版をダウンロードしてください。
A4サイズの用紙に小冊子で印刷し、授業時間に持参してマーカーを引くとよいでしょう。 |
参考書 | 『統計学が最強の学問である』 西内啓 ダイヤモンド社 2013 『ヤバい統計学』 カイザー・ファング CCCメディアハウス 2011 『データ分析の力 因果関係に迫る思考法』 伊藤 公一朗 光文社新書 2017 NGU CROSS[E}にある「経済学部生のための基礎知識100DX」に統計学の動画コンテンツがあるので、これらを視聴し、理解を深めてください。 |
指定図書 | -指定図書は、登録されていません。- |
【評価方法】
感染症などで授業形態が変化することがあるため、おおよその目安としてください。
(これらについては授業中に触れていきます。)
1. 予習(動画視聴やテキスト・自学自習のMinutePaper)の状況(25%)
2. 授業参加の状況:毎回の小テスト、演習問題のMinutePaper、授業理解度調査など(25%)
3. 期末テスト・中間テストを含む複数回の確認テスト(50%)
4. その他
※予習・授業課題はMinutePaperから提出しますが、提出が全体の半数以下は失格となります。
【講義テーマ】
回数 | テーマ | テーマURL |
1 | ガイダンス(反転授業の練習)/スプレッドシート:行と列, ルーブリック確認(1) | |
2 | データの整理:順位表 | |
3 | 度数分布表/ヒストグラムの作成 | |
4 | データの代表値:算術平均、メジアン、モード | |
5 | 散らばりの尺度:レンジ、四分位範囲/箱ひげ図 | |
6 | 散らばりの尺度:平均からの偏り(偏差)と偏差平方和 | |
7 | 散らばりの尺度:分散から標準偏差 | |
8 | これまでの応用(偏差値)と前半の確認:中間テスト, ルーブリック確認(2) | |
9 | 中間テストのフィードバック、ヒストグラムからの計算 | |
10 | 2変数の関係:散布図から平均偏差、象限 | |
11 | 2変数の統計量:偏差の積和、共分散・相関係数の導出 | |
12 | 因果関係:データの中心を通る直線 | |
13 | 残差の概念と残差平方和の計算 | |
14 | 残差平方和最小の条件:最小2乗推定量 | |
15 | 適合度としての決定係数、講義まとめ(因果関係と相関関係), ルーブリック確認(3) | |
16 | 定期試験 | |