Python数据分析与挖掘基础教学大纲
下面是小编为大家整理的Python数据分析与挖掘基础教学大纲,供大家参考。
《python数据分析与挖掘基础》课程教学大
纲
课程代码:
学分:4
学时:64(其中:讲课学时:42 实践或实验学时:22)
先修课程:数学分析、高等代数、概率统计、Python程序设计基础
适用专业:信息与计算科学
建议教材:黄恒秋主编.Python金融数据分析与挖掘实战[M]. 北京:人民邮电出版社.2019. 开课系部:数学与计算机科学学院
一、课程的性质与任务
课程性质:专业方向选修课。
课程任务:大数据时代,数据成为决策最为重要的参考之一,数据分析行业迈入了一个全新的阶段。通过学习本课程,使得学生能够掌握Python科学计算、数据处理、数据可视化、挖掘建模等基本技能,能够针对基本的数据挖掘问题与样例数据,调用Python中的第三方扩展包Numpy、Pandas、Matplotlib、Scikit-learn及关联规则算法代码,进行处理、计算与分析,从而为其他的专业领域课程或者复杂应用问题提供基础支撑。
二、课程的基本内容及要求
本课程教学时数为64学时,4学分;实验22学时,1.375学分。
第一章Python基础
1.课程教学内容:
(1)Python及其发行版Anaconda的安装与启动、Spyder开发工具的使用和Python 新库的安装方法;
(2)Python基本语法和数据结构。
2.课程的重点、难点:
(1)重点:Python基本语法和数据结构的灵活运用;
(2)难点:Python数据结构的灵活运用。
3.课程教学要求:
(1)了解Python的安装及界面基本使用技能;
(2)理解Python基本数据结构及方法的使用;
(3)掌握Python基本数据结构的使用技能及循环、条件语句的应用。
第二章科学计算包Numpy
1.课程教学内容:
(1)导入并使用Numpy创建数组;
(2)数组的运算、切片、连接及存取、排序与搜索;数组相关属性与方法;
(3)矩阵及线性代数运算。
2.课程的重点、难点:
(1)重点:数组的切片、连接、改变形态。数组的相关方法;
(2)难点:数组的切片及改变形态、线性代数运算。
3.课程教学要求:
(1)了解Numpy及导入使用;
(2)理解数组的创建、切片、连接、存取、排序及搜索相关技能;
(3)掌握数组灵活切片的方法及数组连接、排序、搜索相关知识。
第三章数据处理包Pandas
1.课程教学内容:
(1)导入并使用Pandas创建数据框和序列;
(2)数据框和序列相关属性、方法的介绍及使用;
(3)数据框和序列的访问、切片及运算;
(4)外部数据文件的读取及滚动计算函数的使用。
2.课程的重点、难点:
(1)重点:数据框、序列相关属性、方法的应用,数据框和序列数据的访问、切片及相互之间的转换。常用外部数据文件的读取;
(2)难点:数据框、序列的访问及切片。数据框、序列、数组、列表相关数据结构之间的相互转换。
3.课程教学要求:
(1)了解Pandas导入及创建数据框和序列;
(2)理解数据框和序列的访问、切片及方法;
(3)掌握数据框和序列相关方法的灵活应用,数据框、序列、数组、列表之间的相关转换及运用。
第四章数据可视化包Matplotlib
1.课程教学内容:
(1)导入并使用Matplotlib中的pyplot模块进行简单绘图;
(2)Matplotlib中的pyplot模块绘图基本流程及原理;
(3)利用Matplotlib中的yplot模块绘制常见的图形,包括散点图、线性图、柱状图、直方图、饼图、箱线图和子图。
2.课程的重点、难点:
(1)重点:利用Matplotlib中的pyplot模块进行散点图、线性图、柱状图、直方图、饼图、箱线图和子图的绘制。懂得图形中文字符的显示及横轴字符刻度,子图的布局排列;
(2)难点:Matplotlib绘图的基本流程及原理。
3.课程教学要求:
(1)了解Matplotlib中的pyplot模块导入及简单使用方法;
(2)理解利用Matplotlib中的pyplot模块绘图的基本流程及原理;
(3)掌握利用Matplotlib中的pyplot模块绘制散点图、线性图、柱状图、直方图、饼图、箱线图和子图的方法,以及中文字符的显示、横轴字符刻度和子图的布局排列。
第五章机器学习包Scikit-learn
1.课程教学内容:
(1)导入Scikit-learn包及相关模块;
(2)缺失值填充、数据规范化或标准化、主成分分析降维及综合评价、线性回归、逻辑回归、神经网络、支持向量机、K-均值聚类相关的模型、算法与原理;
(3)利用Scikit-learn包相关模块,完成案例教学,包括均值、中位数、最频繁值的缺失值填充策略,均值-方差、极差数据规范化或标准化,主成分分析降维及综合评价,线性回归、神经网络非线性回归预测,逻辑回归、神经网络、支持向量机分类,K-mean聚类;
2.课程的重点、难点:
(1)重点:均值、中位数、最频繁值的缺失值填充策略,均值-方差、极差数据规范化或标准化,主成分分析降维及综合评价,线性回归、神经网络非线性回归预测,逻辑回归、神经网络、支持向量机分类,K-mean聚类相关原理的理解及程序实现;
(2)难点:主成分分析降维及综合评价,线性回归、神经网络非线性回归预测,逻辑回归、神经网络、支持向量机分类,K-mean聚类相关原理的理解。
3.课程教学要求:
(1)了解Scikit-learn包及相关模块导入及简单使用方法;
(2)理解均值、中位数、最频繁值的缺失值填充策略,均值-方差、极差数据规范化或标准化,主成分分析降维及综合评价,线性回归、神经网络非线性回归预测,逻辑回归、神经网络、支持向量机分类,K-mean聚类相关的基本原理与方法;
(3)掌握均值、中位数、最频繁值的缺失值填充策略,均值-方差、极差数据规范化或标准化,主成分分析降维及综合评价,线性回归、神经网络非线性回归预测,逻辑回归、神经网络、支持向量机分类,K-mean聚类的程序实现及案例应用。
第六章关联规则基础
1.课程教学内容:
(1)关联规则、一对一关联规则与多对一关联规则基本概念;
(2)布尔数据集的转换、布尔关联规则挖掘原理及程序实现;
(3)国际股票指数关联规则挖掘应用案例。
2.课程的重点、难点:
(1)重点:布尔数据集转换、布尔关联规则挖掘程序实现;
(2)难点:布尔数据集转换、关联规则挖掘原理、综合案例的运用;
3.课程教学要求:
相关热词搜索: python数据分析实战 教学大纲 挖掘 基础