一、学习目标:
熟练掌握数据科学领域受欢迎的编程语言-Python
掌握使用Python和pandas库进行数据清洗和预处理
使用Python爬虫获取网络数据
学会使用matplotlib、seaborn进行初级可视化
学会使用Pyecharts进行数据可视化
学会构建机器学习算法进行分类、预测和聚类模型
使用Python进行数据分析整体思路、针对业务做出模型优化选择
善用机器学习解决用户画像、精准营销、风险管理等商业问题
使用机器学习实操电商、金融、电信、医药行业真实项目案例
二、课程内容:
1章Python基础
1-1准备工作-Python开发环境配置
1-2Python标准数据类型
1-3控制流语句
1-4异常和错误(穿插在其他内容中讲)
1-5文件操作
2章Python进行数据整理和数据清洗
2-1Python标准库简介
2-2Numpy数组基础
2-3 Pandas对象基础
3章python数据可视化(线上)
3-1绘图思想的基本原理
3-2Python数据可视化包-Matplotlib介绍
3-3使用Python数据处理包Pandas做可视化
3-4Python数据可视化包-Seaborn介绍与图形绘制
3-5Python数据可视化包-Pyecharts介绍与图形绘制
4章Python爬虫(线上)
4-1网络爬虫基础知识
4-2网络请求及响应-requests库
4-3HTML文档解析-BeautifulSoup库
4-4常见反爬虫机制及应对
4-5网络爬虫 VS 网络数据抓取
4-6实战一:批量下载头像
4-7实战二:抓取豆瓣书籍简介
4-8实战三:模拟浏览器selenium抓取电商商品信息及评论
5章Python数据清洗操作及案例实战
5-1数据的获取与存储
5-2数据探索
5-3数据清洗思维
5-4数据清洗实战案例一:泰坦尼克幸存者数据清洗(根据实际上课情况调整数据集)
5-5数据清洗实战案例二:USDA食品数据清洗(根据实际上课情况调整数据集)
6章Python编程考试(线上)
6-1Python基础部分
6-2Python数据清洗的实现
7章机器学习算法
7-1准备工作:开发环境配置(以文档的形式给出)
7-2机器学习入门介绍:
7-3scikit-learn入门:Scikit-Learn库简介
7-4KNN-近邻分类算法:原理、实现
7-5决策树算法:原理、实现、相关技术应用及实例
7-6随机森林算法:原理、实现及相关技术应用:以乳腺癌预测为例
7-7K-Means聚类算法:原理、实现及簇选择与矢量化应用
7-8关联规则算法:原理、实现
7-9线性回归
7-10逻辑回归
7-11SVM支持向量机
7-12分类模型的评估指标(续)
7-13朴素贝叶斯算法
8章电商案例
8-1分析目标:
8-2基于国外大型电商用户购买信息数据的客户购买预测模型构建流程:
9章金融案例
9-1分析目标:
9-2基于大型金融公司的客户信息,构建用户信用评分卡模型的建模步骤:
温馨提示
温馨提示