CDA Python机器学习周末集训营【Level Ⅲ】,为想希望从事数据挖掘、机器学习工程师相关岗位的人员或者希望通过CDA三级认证考试人员开设。课程设计循序渐进,从基础工具与理论知识入门,进阶机器学习模型、文本挖掘模型,以实战项目案例贯穿课程讲解。其中包括:Python编程基础、数据清洗、数据处理与特征工程、Python机器学习、自然语言处理等课程模块。课程理论知识涵盖CDA LEVEL III等级考试的所有考点,有利于对应等级考试的学员备考。
熟练掌握数据科学领域最受欢迎的编程语言-Python
掌握使用Python和pandas库进行数据清洗和预处理
学会使用matplotlib、seaborn进行初级可视化
学会使用Pyecharts进行高级数据可视化
学会构建机器学习算法进行分类、预测和聚类模型
善用机器学习解决用户画像、精准营销、风险管理等商业问题
机器学习零基础学员
高校在校生
待业、期待转行从事数据挖掘相关岗位的在职人员
CDA数据分析师level Ⅲ 考生。
希望借助数据挖掘算法来提升解决企业运营、产品运营中涉及的预测问题者
对数据挖掘技术感兴趣的各界人士
产品、运营、营销、管理、咨询相关岗位从业者,希望增加数据挖掘技能与思维
细分课程 | 周 | 日 | 内容 | 详细内容 |
预习课 (录播) |
数据库SQL | 1. 数据库基本概念 2. DDL数据定义语言 3. DML数据操作语言 4. 单表查询 5. 多表查询 6. Python连接SQL |
||
Python编程 | 1. Python标准数据类型 2. 控制流语句 3. 自定义函数 4. 异常和错误 5. 类与面向对象编程 6. Numpy数组操作 7. 用Python做数据分析,必会的库Pandas 8. 用Pandas做数据清洗与数据探索 9. Python数据可视化库(Matplotlib,Seaborn) |
|||
数学与统计学基础 | 1. 线性代数 2. 微积分 3. 描述性统计 4. 参数估计 5. 假设检验 6. 相关分析 7. 卡方分析 8. 一元线性回归理论推导 9. 多元线性回归理论推导 |
|||
附加内容 | 第1周 | 周六 | ETL数据接入与数据模型管理 | 1. 数据分类 2. 数据建模 3. ETL基本概念与常用工具 4. 基于Python的ETL程序开发 5. ETL实战项目 6. 数据接入策略与调度工具 |
机器学习进阶 (Level 3) |
周日 | 大数据平台Spark,数据挖掘导论 | 1. 数据挖掘导论 2. 梯度下降 3. 分布式存储与计算 4. Spark与Flink工作原理 5. Spark基本语法 6. 使用PySpark实现分布式计算 |
|
第2周 | 周六 | 决策树 | 1. 决策树与信息熵 2. ID3, C4.5, CART树 3. 模型调优:网格搜索与交叉验证 4. 决策树的PySpark实现 5. 分类模型的评估(混淆矩阵,ROC等) 6. 决策树之欺诈识别案例 |
|
周日 | 正则回归,Pipeline | 1. 正则项的理论基础 2. 带正则项的回归 3. Pipeline工作流专题 4. 使用Pipeline部署算法模型 |
||
第3周 | 周六 | 关联规则与协同过滤 | 1. 关联规则(关联规则的概念,评估指标,Apriori算法) 2. 协同过滤 3. 大数据环境下的协同过滤实现 4. 产品组合策略-零售产品捆绑销售策略分析案例 |
|
周日 | 集成算法基础 | 1. 集成学习的理论基础 2. Bagging, Boosting, Stacking 3. AdaBoost 4. 随机森林 5. GBDT, XGBoost |
||
第4周 | 周六 | 爬虫,文本分析 | 1. 数据的爬取(http原理, requests应用, HTML结构及xpath应用) 2, 非结构化数据的加工处理 3. 文本数据处理之正则表达式 |
|
周日 | 机器学习进阶,人工智能基础 | 1. LightGBM 2. 数据不平衡问题 3. 进阶调参方法python实践 4. 贝叶斯调参python实践 5. 人工智能基础与网页端的使用 6. 常用人工智能软件 7. 人工智能相关库的环境配置 |
||
第5周 | 周六 | 人工智能基础 | 1. 深度神经网络基础:感知器及多层感知器 2. 神经网络架构 3. BP反向传播算法 4. 优化算法专题 5. 卷积神经网络(选修) 6. Pytorch框架与代码实践 7. Openai api之python代码实践 8. 图像分析-手写数字自动识别 |
|
周日 | 聚类分析进阶与异常识别 | 1. 聚类分析进阶(密度聚类,高斯混合聚类) 2. 聚类分析的Spark实现 3. 异常识别(孤立森林,局部异常因子) 4. 交易反欺诈-异常交易识别案例 |
||
第6周 | 周六 | 人工智能NLP之文本挖掘 | 1. 分词与词性标注 2. 文本信息提取 3. 词嵌入与词模型(CBOW与Skip-gram) 4. 构建文本信息库 5. 文本聚类算法 6. 词模型的Pytorch实现 7. 文本分类算法的Pytorch实现 |
|
周日 | 大型项目案例 | 实战项目-金融风控大型案例 | ||
第7周 | 周六 | 人工智能NLP之大语言模型LLM | 1. 循环神经网络RNN 2. 编码器与迁移学习 3. 残差连接ResNet 4. Transformer架构 5. 大语言模型LLM技术架构与训练方法 6. 开源模型平台与框架的代码实践 7. LLM的本地化部署 |
|
第8周 | 周六 | 大语言模型LLM前沿方法 | 1. 聊天机器人的本地化部署 2. Fine tuning 3. Lora专题 4. 本地化LLM的tuning代码实践 5. Agent与Lang Chain 6. 向量数据库与知识库 7. 人工智能NLP的前沿方向 |
|
CDA认证考试辅导 (仅限报名考试的学生) |
Level 3 认证考试辅导 | CDA Level 3 认证考试辅导 1. 数据挖掘概论 2. 高级数据处理与特征工程 3. 自然语言处理与文本分析 4. 机器学习算法 5. 机器学习进阶(自动机器学习,样本不平衡问题,半监督学习,模型优化) |
||
选修课 | 选修课 | 1、互联网数字化运营【18课时】 2、何为数据产品经理?【1课时】 3、Python爬虫【15课时】 4、人工智能(深度学习)实战之图像识别【6课时】 5、Tableau多维可视化分析【3课时】 6、SPSS统计分析【12课时】 |