本年度的学习计划于昨天拉开帷幕。
最难啃的是数据分析相关的学习,不但需要计算机编程、数据库等相关知识,还需要了解数学,尤其是统计分析方面的概念和算法。
已经学习了两天,进行一下总结。
本周的计划是完成《商务与经济统计学》一书的前八章,以及《统计学入门》的视频课程。
昨天花了4个小时完成了《商务与经济统计学》的第一二章,今天用4个半小时完成了第三四章的学习。
第一章:数据和统计
主要包括数据、数据来源、描述性统计、统计推断四个部分。
数据包括数据和数据集的概念,以及元素、变量、观测值的概念,度量尺度的概念(包括名义尺度、序数尺度、区间尺度、比例尺度),定性和定量数据,截面数据和时间序列数据。
数据来源包括现存数据源、统计研究,并提到了数据采集的误差。
描述性统计提到了第二三章的表格法和图形法的描述性统计,以及数值法的描述性统计。
统计推断讲到了总体、样本的概念,以及什么是统计推断。
第一章主要是一些基础概念,不难,但刚开始看很容易分心,所以花的时间比较久。
第二章:描述性统计:表格法和图形法
主要包括汇总定性数据、汇总定量数据、探索性数据分析:茎叶显示、交叉分组列表和散点图。
汇总定性数据包括频数、相对频数、百分比频数分布、柱状图及饼状图。
汇总定量数据包括频数、相对频数、百分比频数分布、点位图、直方图、累积分布及累积曲线。
茎叶显示主要描述了一种数据分析的探索性方法。
交叉分组列表和散点图用来描述变量间关系来汇总数据。
第三章:描述性统计:数值方法
主要包括位置的变量、变异程度的变量、相对位置的度量和异常值的检测、探索性数据分析、两变量间关系的度量、加权平均值和使用分组数据。
位置的变量 包括均值、中位数、众数、百分位数、四分位数。
变异程度的变量包括极差、四分位点距、方差、标准差、变异系数。
相对位置的度量和异常值的检测 包括z-分数、切比雪夫定理、经验法则、异常值检测。
探索性数据分析 包括五数概括法、箱形图。
两变量间关系的度量 包括协方差、相关系数。
加权平均值和使用分组数据 主要进行加权平均值的计算,以及分组数据的均差、方差计算。
第四章:概率论简述
主要包括试验、计数法则和概率指派、事件和它们的概率、概率的一些基本关系、条件概率、贝叶斯定理。
试验、计数法则和概率指派 包括多步骤试验、组合和排列,三种常用概率指派。
事件和它们的概率 主要讲了什么是事件和概率的概念。
概率的一些基本关系 包括事件的补、事件的并、事件的交、加法法则、互斥事件
条件概率 包括条件概率P(A|B)计算方法、独立事件、乘法法则。
贝叶斯定理 主要讲了贝叶斯定理用来进行概率修正,以及贝叶斯计算公式、贝叶斯表格。
后续的计算量比较大,概念也比较多。需要把每一部分都理解好,才能衔接好接下来的部分。
由于内容多,很容忘记之前所看的内容,所以学完一遍后要复习一次。想全部记住是很难的,主要为之后的学习先打一个基础,后续学习出现统计分析的概念时不至于成为阻碍。
明天进行第五、六章的学习。争取能将第七章也完成。
另外这两天还加入了好报小组,每天提交500字的文章1篇。并看了网易云课堂的课程若干节。开始用now then记录时间,界面不如ihour美观,略显粗糙,好处是可以增加子栏目,便于分组统计。
网友评论