搜索

取消
课程简介适用人群课程大纲付款方式

Python和R数据挖掘技术-基于Python和R语言的数据挖掘和统计分析技术

培训天数:2天

公开课费用:线下:5900;线上:4700

对基于Python和R语言进行数据处理、数据探索的基本方法,利用R语言实现模型选择、Logistic回归及决策树算法,以及贝叶斯算法及支持向量机、神经网络等算法原理及实现进行讲解。

随着互联网、移动互联网和物联网的发展,我们已经切实地迎来了一个大数据的时代。如何对海量数据进行挖掘和分析,已经成为一个非常重要且紧迫的需求。
R是一个用于统计计算和统计制图的优秀工具,也是GNU的一个自由、免费、源代码开放的软件。R包括一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统,数组运算工具(其向量、矩阵运算方面功能尤其强大),完整连贯的统计分析工具,优秀的统计制图功能。
Python是一个数据分析和图形显示的程序设计环境,用于统计分析、绘图的语言和操作环境。Python有简便而强大的编程语言:可操纵数据的输入和输入,可实现分支、循环,用户可自定义功能。

本培训将对基于Python和R语言进行数据处理、数据探索的基本方法,利用R语言实现模型选择、Logistic回归及决策树算法,以及贝叶斯算法及支持向量机、神经网络等算法原理及实现进行讲解。

 

培训目标

1, 全面了解Python和R语言数据挖掘的相关知识。

2,学习Python和R的数据挖掘核心技术方法以及应用特征。

3,深入使用Python和R在数据挖掘和分析中的使用。

 

证书

培训结束,颁发中科院计算所职业培训中心“Python和R数据挖掘技术-基于Python和R语言的数据挖掘和统计分析技术”结业证书。

 

本课程有企业内训形式,授课老师、课程内容、教学方式均依据企业的培训需求灵活设置。

 

本网站内容包括并不限于课程介绍、课程大纲、上课照片、老师介绍等等资料及信息,未经允许不得抄袭和转载。

一、培训对象

1,系统架构师、系统分析师、高级程序员、资深开发人员。

2,牵涉到数据挖掘和统计分析的数据中心运行、规划、设计负责人。

3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。

4,高校、科研院所牵涉到数据挖掘与统计分析处理的项目负责人。

 

二、学员基础

1,对IT系统设计有一定的理论与实践经验。

2,对数据挖掘和数据处理方法有一定的基础知识。

3,对Hadoop/Spark等大数据技术有一定的了解。

培训内容

第1讲、数据挖掘与分析流程

  1) 数据挖掘、分析及其应用

  2) CRISP-DM过程

  3) 数据建模主要方法

  4) 数据挖掘中的关键技术

第2讲、R介绍及环境搭建

  1) R语言介绍

  2) R语言数据挖掘

  3) R分析环境搭建

  4) RStudio安装

第3讲、Python介绍及环境搭建

  1) Python语言介绍

  2) Python语言数据挖掘

  3) Python分析环境搭建

  4) Python数据挖掘应用

第4讲、Python数据计算与可视化

  1) Python中计算与可视化技术

  2) NumPy简单应用

  3) SciPy简单应用

  4) SciPy简单应用

  5) Matplotlib简单应用

第5讲、R数据可视化展现

  1) 查看R中的数据

  2) 单个变量展现

  3) 多个变量展现

  4) 更多数据探索方法

  5) 将图表保存到文件中

第6讲、分类技术及其子类

  1) 分类及有指导的分析方法

  2) 五大类主要分类方法介绍

  3) 分类的主要流程分析

  4) 分类涉及的评估指标

  5) 分类在在行业应用分析

第7讲、K近邻及其建模和应用

  1) K近邻(kNN) 方法介绍

  2) K近邻中的距离计算

  3) 使用K近邻构建分类应用

  4) Python中的K近邻实现案例

  5) K近邻在行业应用分析

第8讲、决策树及其建模和应用

  1) 决策树方法介绍

  2) 使用party包构建决策树

  3) 使用rpart包构建决策树

  4) Python中的决策树实现案例

  5) 决策树在行业应用分析

第9讲、贝叶斯分析及其建模和应用

  1) 贝叶斯方法介绍

  2) R中的朴素贝叶斯方法

  3) R贝叶斯方法应用

  4) Python中的贝叶斯实现案例

  5) 贝叶斯分析在行业应用分析

第10讲、回归分析及其建模和应用

  1) 主要回归分析方法介绍

  2) R中的线性回归方法介绍

  3) R中的逻辑回归方法介绍

  4) Python中的回归实现案例

  5) 回归分析在行业应用分析

第11讲、时间序列分析及其建模和应用

  1) 时间序列分析方法介绍

  2) R中的时间序列分解

  3) R时间序列预测与聚类

  4) Python中的时间序列实现案例

  5) 时间序列分析在行业应用分析

第12讲、聚类分析及其建模和应用

  1) 聚类与无指导分析方法介绍

  2) R中k-means和k-medoids聚类

  3) R层次聚类和基于密度聚类

  4) Python中的聚类实现案例

  5) 聚类分析在行业应用分析

汇款、微信转帐

汇款信息:

单位名称:北京市海淀区中科院计算所职业技能培训学校

开户行:工行海淀西区支行

账号:0200 0045 1920 0043 667

开户银行代码:1021 0000 0458

 

微信转账:

    步骤一:打开微信,扫描二微码付款时,点击打开微信右下角里的“发现”,在列表界面有一个“扫一扫”选项,点击打开“扫一扫”(如下图):

    步骤二:点击打开“扫一扫”后,会出现一个扫描框,将中科院计算所培训中心二维码/条码放入框内,即可自动扫描,并显示支付信息,输入付款金额。

                                                                                                        

    (中科院计算所培训中心二维码)

 

    步骤三:点击 “添加付款备注”,填写付款人姓名和单位全称,所有信息核对无误后,点击“确认付款”,完成支付。

 

                

 

  • 注意:步骤三是为了尽快确认您的培训费用是否到帐,方便为您查帐,所以一定要把付款人姓名和单位名称填写完整,如果姓名和单位名称超过20个汉字,单位名称可以填写简称。
京公网安备 11010802025851号 | 京ICP备14030124号-1
版权所有:© 2018 中科院计算所培训中心 .All Rights Reserved.

邀请好友一起学习

微信 QQ 新浪微博