热烈欢迎参加Uplatz的Python数据科学、人工智能和机器学习课程。数据科学数据科学是一个跨学科领域,专注于从结构化和非结构化数据中提取知识和见解。它涉及从统计学、计算机科学和信息理论中各种技术,以分析和解释复杂数据。Data Science, AI, Machine Learning with Python

关键组成部分:数据收集:从各种来源收集数据。数据清洗:通过处理缺失值、异常值等,准备数据进行分析。数据探索:分析数据以了解其结构和特征。数据分析:应用统计学和机器学习技术提取见解。数据可视化:将数据呈现在视觉环境中,使分析结果易于理解。Python在数据科学中Python广泛用于数据科学,因为它简单易用,并且拥有强大的库:Pandas:用于数据处理和分析。NumPy:用于数值计算。Matplotlib和Seaborn:用于数据可视化。SciPy:用于高级统计操作。Jupyter笔记本:用于交互式数据分析和共享代码和结果。人工智能(AI)人工智能是机器能够以我们认为是“聪明”的方式执行任务的更广泛概念。它包括从计算机程序下棋到语音识别系统如Siri和Alexa等各种内容。关键组成部分:专家系统:模拟人类专家决策能力的计算机程序。自然语言处理(NLP):理解和生成人类语言。机器人技术:设计和编程机器人执行任务。计算机视觉:解释和理解来自世界的视觉信息。Python在AI中Python被认为是AI中的首选,因为它易于使用,并通过各种库提供广泛支持:TensorFlow和PyTorch:用于深度学习和神经网络。OpenCV:用于计算机视觉任务。NLTK和spaCy:用于自然语言处理。Scikit-learn:用于一般机器学习任务。Keras:用于简化神经网络的创建。机器学习(ML)机器学习是涉及让计算机从数据中学习并根据数据进行预测或决策的算法开发的AI子集。它可以分为监督学习、无监督学习和强化学习。关键组成部分:监督学习:算法在带标签的数据上进行训练。无监督学习:算法在无标签数据中找到模式。强化学习:算法通过与环境交互学习以最大程度地获得累积奖励。Python在机器学习中由于其强大的库和社区支持而被广泛使用:Scikit-learn:用于实现基本的机器学习算法。TensorFlow和PyTorch:用于构建和训练复杂的神经网络。Keras:用于简化神经网络的创建。XGBoost:用于梯度提升框架。LightGBM:针对速度和性能进行优化的梯度提升框架。

由Uplatz培训创建
MP4 | 视频:h264, 1280×720 | 音频:AAC, 44.1 KHz, 2 Ch
类型:电子学习 | 语言:英语 | 时长:55讲座(49小时54分钟)| 大小:25.8 GB

完整的Python课程:从基础到高级的数据科学、人工智能和机器学习

你将学到什么:
学习数据科学、人工智能和机器学习的基础知识
了解并实现Python环境设置
介绍面向人工智能、数据科学和机器学习的Python编程
学习数据导入
了解探索性数据分析和描述性统计
掌握概率论和推断统计学
学习如何使用Python进行数据可视化
深入了解使用Python编程进行数据清洗、数据处理和预处理
了解预测建模和机器学习

要求:
热情和决心在世界上留下自己的印记!

课程概览:
数据科学和Python环境设置概述
数据科学概述
数据科学简介
数据科学组件
受数据科学影响的垂直领域
数据科学用例和业务应用
数据科学项目生命周期
Python环境设置
Anaconda发行版简介
安装Python的Anaconda
Anaconda导航器和Jupyter笔记本
Markdown简介和脚本
Spyder IDE简介和特性
Python编程简介
变量、标识符和运算符
变量类型
语句、赋值和表达式
算术运算符和优先级
关系运算符
逻辑运算符
成员运算符
可迭代/容器
字符串
列表
元组
集合
字典
条件语句和循环
如果其他
while循环
for循环
继续、中断和通过
嵌套循环
列表解析
函数
内置函数
用户定义函数
命名空间和作用域
递归函数
嵌套函数
默认和灵活参数
Lambda函数
匿名函数
数据导入
平面文件数据
Excel数据
数据库(MySQL、SQLite…等)
统计软件数据(SAS、SPSS、Stata…等)
基于网络的数据(HTML、XML、JSON…等)
云托管数据(Google表格)
社交媒体网络(Facebook、Twitter、Google表格API等)
数据清洗、数据处理和预处理
处理错误、缺失值和异常值
无关和不一致的数据
重塑数据(添加、筛选和合并)
重命名列和数据类型转换
特征选择和特征缩放
有用的Python包
Numpy
Pandas
Scipy
探索性数据分析和描述性统计
变量类型和测量尺度
定性/分类
名义
序数
定量/数值
离散
连续
间隔
比率
中心趋势测量
平均值、中位数、众数
变异性和形态测量
标准差、方差和范围、IQR
偏度和峰度
单变量数据分析
双变量数据分析
多元数据分析
概率论和推论统计
概率和概率分布
概率简介
频率和累积频率
交叉制表或列联表的频率
2个或多个事件的概率
条件概率
独立和相关事件
互斥事件
贝叶斯定理
二项分布
均匀分布
卡方分布
F分布
泊松分布
学生t分布
正态分布
抽样、参数估计和统计检验
抽样分布
中心极限定理
置信区间
假设检验
z检验、t检验、卡方检验、ANOVA
Z分数和p值
相关性和协方差
数据可视化
绘图图表和图形
散点图
条形图/堆叠条形图
饼图
箱线图
直方图
折线图
ggplot2、lattice包
Matplotlib和Seaborn包
交互式数据可视化
Plotly
统计建模与机器学习
回归分析
简单线性回归
多元线性回归
多项式回归
分类
逻辑回归
K近邻(KNN)
支持向量机
决策树、随机森林
朴素贝叶斯分类器
聚类
K均值聚类
层次聚类
DBSCAN聚类
关联规则挖掘
Apriori
购物篮分析
维度缩减
主成分分析(PCA)
线性判别分析(LDA)
集成方法
Bagging
Boosting
端到端毕业项目

发表回复

后才能评论