数据科学是一个多学科领域,它利用一系列技术、算法、流程和系统从结构化和非结构化数据中提取有意义的见解和知识。数据科学在当今世界具有重要意义,因为它对业务、研究和决策制定的各个方面产生了变革性影响。它结合了统计学、计算机科学、领域专业知识和数据分析的元素,以分析和解释复杂数据。数据科学使组织能够基于数据分析而不是仅仅依靠直觉或经验做出明智的决策。这导致了更准确和有效的决策过程。在这门课程中,学生将学习开发数据科学项目的整个过程。在这门课程中,学生将学习数据科学的细微之处,数据收集、数据清洗、数据可视化、统计学的重要性和机器学习等。我们将使用R编程语言来开发数据管道。R是一种专门设计用于统计计算和图形的编程语言和环境。它是开源的,并且被统计学家、数据科学家、研究人员和分析师广泛使用于数据分析、统计建模和可视化。R拥有丰富的包和库生态系统,扩展了它的功能。这些包涵盖了广泛的领域,从机器学习和数据操纵到生物信息学和金融。所以,让我们做好准备吧!

MP4 |视频:h264,1920×1080 |音频:AAC,44.1 KHz
语言:英语|大小:4 GB |课程时长:7小时13分钟

你会学到什么
数据科学的定义
数据收集和预处理
统计数字
预测建模

该课程适用于任何对数据科学领域感兴趣的人

课程目录:
第一部分:关于项目

第1讲课程介绍

第2讲课程大纲

第2部分:数据科学简介

第三讲什么是数据科学?

第四讲什么是数据?

第5讲数据有什么用

第6讲数据科学工具和技术

第7讲数据科学流程

第8讲数据科学的应用

第三节:钢筋混凝土基础

第9讲R语言介绍

第十讲R语言和R Studio的安装

第11讲处理R环境

第12讲设置工作目录

第13讲数据类型和变量

第14讲算术运算

第15讲数据框架

第4节:数据收集

第16讲数据科学方法论

第17讲数据收集技术

第18讲网络抓取简介

第19讲使用R语言进行网络抓取

第5节:数据预处理

第20讲数据预处理的意义

第21讲检查数据格式

第22讲处理缺失数据

第23讲处理分类数据

第24讲异常值分析

第25讲数据缩放

第6节:描述性统计

第26讲统计学在数据科学中的意义

第27讲数据科学的描述性统计工具

第28讲集中趋势的度量

第29讲数据的变化

第30讲变量的关联

第7节:推理统计学

第31讲什么是推断统计学?

第32讲置信区间

第33讲R语言中的置信区间

第34讲学生t分布

第35讲R语言的T-Test

第36讲假设检验

第37讲R语言中的假设检验

第8节:预测建模

第38讲什么是预测分析?

第39讲线性回归介绍

第40讲R语言中的简单线性回归

第41讲多元线性回归介绍

第42讲R语言中的多元线性回归

第9节:分类

第43讲分类模型介绍

第44讲逻辑回归介绍

第45讲逻辑回归的实现

第46讲随机森林分类介绍

第47讲R语言中的随机森林分类

第10节:降维

第48讲降维介绍

第49讲主成分分析导论

第50讲R语言中的主成分分析

第11节:关于计划

第51讲课程结束

发表回复

后才能评论