《机器学习实战——基于Python SKlearn的解析》[50M]百度网盘|pdf下载|亲测有效
《机器学习实战——基于Python SKlearn的解析》[50M]百度网盘|pdf下载|亲测有效
《机器学习实战——基于Python SKlearn的解析》[50M]百度网盘|pdf下载|亲测有效
《机器学习实战——基于Python SKlearn的解析》[50M]百度网盘|pdf下载|亲测有效
《机器学习实战——基于Python SKlearn的解析》[50M]百度网盘|pdf下载|亲测有效
《机器学习实战——基于Python SKlearn的解析》[50M]百度网盘|pdf下载|亲测有效

机器学习实战——基于Python SKlearn的解析 pdf下载

isbn:9787113291693
出版社 中国铁道出版社
出版年 2022-06-01
页数 220页
ISBN 9787113291693
装帧 精装
评分 9.2(豆瓣)
限时特惠 00:00:00
活动结束后恢复原价
纸质书参考价 ¥23
电子版限时价 ¥5.99 省 18 元

选择版本

不满意全额退款
发货失败双倍赔偿
邮箱即时发送

内容简介

本篇主要提供机器学习实战——基于Python SKlearn的解析电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

产品特色

编辑推荐


系统:以“轻原理、重实践”为原则,详细解析机器学习库SKlearn



通俗:从参数调用的角度,适合零基础读者快速入门并掌握SKlearn



深入:由浅及深熟悉数据探索、预处理、模型选择、集成学习、模型评估流程



案例:用五个工程案例系统化讲解SKlearn库分类、回归、聚类,让你码上就用



内容简介

本书前6章介绍基础准备、数据探索、数据预处理、机器学习模型(分类、回归、聚类)、集成学习、模型评估及持久化;第7章介绍机器学习在土木工程中的应用场景,并以五个工程案例系统化讲解SKlearn库的应用。
本书“轻原理、重实践”,适合广大对机器学习有兴趣,并且想系统学习数理统计的读者;也可用作机器学习培训、高校教材或作为学习SKlearn库的工具书。

作者简介

屈希峰,七年Python技术开发相关经验。2017年,使用Flask、MongoDB开发网站;2018年开发微信小程序:注册土木、注道、爱伴读等,其中微信小程序注册土木累计关注者1.2万人;2019年开发Windows桌面应用文字表格公式识别神器.exe,累计用户3千余人。使用Python期间,在知乎开设专栏记录经验,当前知乎关注者2.25万,其中编程专栏关注者4千余人。在工作中,探索Python编程在土木工程工程中的应用,对BIM、GIS以及数值分析软件的二次开发都有涉猎,现阶段工作重心在于如何将物联网及机器学习应用到土木行业智能检测和监测领域。

内页插图

目录

第1章 基础准备
1.1 机器学习
1.1.1 机器学习概述
1.1.2 机器学习任务
1.1.3 机器学习经验
1.1.4 机器学习性能
1.2 Python编程
1.2.1 Python
1.2.2 NumPy和SciPy
1.2.3 Matplotlib
1.2.4 Pandas
1.2.5 SKlearm
1.2.6 Yellowbrick
1.3 Python 环境配置
1.3.1 安装Anaconda
1.3.2 运行Jupyter Notebook
第2章 数据探索
2.1 数据读取和保存
2.1.1 TXT数据
2.1.2 CSV数据
2.1.3 XLS数据
2.1.4 SOL数据
2.1.5 NOSOL数据
2.2 数据特征分析
2.2.1 描述性统计
2.2.2 分布分析
2.2.3 对比分析
2.2.4 相关性分析
第3章 数据预处理
3.1 数据清洗
3.1.1 缺失值处理
3.1.2 异常值处理
3.1.3 数据一致性处理
3.2 数据变换
3.2.1 二元化
3.2.2 独热码
3.2.3 标准化
3.2.4 正则化
3.2.5 数据变换应用
3.3 数据降维
3.3.1 主成分分析
3.3.2 线性判别分析
3.3.3 多维缩放降维
3.3.4 流形学习
3.4 特征选取
3.4.1 过滤式特征选取
3.4.2 包裹式特征选取
3.4.3 嵌入式特征选取
3.5 数据降维与特征选取的差别
第4章 机器学习模型
4.1 线性模型
4.1.1 线性回归模型
4.1.2 逻辑回归模型
4.2 决策树
4.2.1 回归决策树
4.2.2 分类决策树
4.3 贝叶斯分类器
4.3.1 高斯贝叶斯分类器
4.3.2 多项式贝叶斯分类器
4.3.3 伯努利贝叶斯分类器
4.4 KNN
4.4.1 KNN分类
4.4.2 KNN回归
4.5 聚类
4.5.1 K均值聚类
4.5.2 密度聚类
4.5.3 层次聚类
4.5.4 高斯混合聚类
4.6 支持向量机
4.6.1 线性分类
4.6.2 非线性分类
4.6.3 线性回归
4.6.4 非线性回归
第5章 集成学习
5.1 常用的集成学习方法——AdaBoost
5.1.1 分类
5.1.2 回归
5.2 梯度提升树
5.2.1 GBDT算法的分类类——GradientBoostingClassifier
5.2.2 GBDT算法的回归类——GradientBoostingRegressor
5.3 随机森林
5.3.1 RandomForestClassifier模型
5.3.2 RandomForestRegressor模型
第6章 模型评估及持久化
6.1 损失函数
6.1.1 0-1损失
6.1.2 对数损失
6.2 数据切分
6.2.1 train-test-split()方法
6.2.2 KFold()方法
6.2.3 StratifiedKFold()方法
6.2.4 LeaveOneOut()方法
6.2.5 crossVal-score()方法
6.3 性能度量
6.4 参数优化
6.5 模型持久化
第7章 项目实践
7.1 工程应用场景
7.1.1 可行性研究阶段
7.1.2 设计阶段
7.1.3 施工阶段
7.1.4 监理监测
7.1.5 运营维护
7.2 边坡稳定性预测
7.2.1 数据探索
7.2.2 数据预处理
7.2.3 模型选择
7.2.4 模型评估
7.2.5 模型持久化
7.3 地质物探预测
7.3.1 数据探索
7.3.2 数据预处理
7.3.3 集成学习
7.3.4 模型评估
7.3.5 模型持久化
7.4 隧道岩爆分级预测
7.4.1 数据探索
7.4.2 数据预处理
7.4.3 集成学习
7.4.4 模型评估
7.4.5 模型持久化
7.5 混凝土强度预测
7.5.1 数据探索
7.5.2 数据预处理
7.5.3 模型选择
7.5.4 参数优化
7.5.5 模型持久化
7.6 膨胀土膨胀性等级分类
7.6.1 数据探索
7.6.2 数据预处理
7.6.3 分类簇数选择
7.6.4 模型评估
7.6.5 模型持久化

前言/序言

近些年,机器学习广泛应用于计算机、医疗、金融、智能设备等领域。目前,关于机器学习的书籍种类繁多,有科普性质的初级系列,也有深度解析原理、手写算法系列,但以工程案例为背景的系统化图书较少,尤其在土木工程等传统行业,乏善可陈;笔者查询了一些有关土木领域的科研论文及毕业论文,关于机器学习的论文数量也有限。然而公众号以及知乎上的土木同行对 Python,尤其是机器学习在行业中的应用非常期待,寄希望于降低日常重复性工作环节(诸如设计、施工、科研等)。

因此,笔者从自己熟悉的岩土领域,本着“轻原理、重实践”的原则,避开复杂的机器学习原理,从参数调用(调包)的角度,解析机器学习库 SKlearn 的常用模型。本书适合零基础的读者,以便快速入门并掌握 SKlearn 的精髓。



■ 本书构架



章名

主要内容

第 1 章

主要介绍机器学习的基本理论、相关 Python 库和必要的编程环境配置

第 2 章

介绍如何使用 Pandas 库加载数据,并对数据进行探索性分析。例如,查看数据的统计特征、分布、相关性等



第 3 章

介绍数据预处理方法。通常我们拿到的数据或多或少都存在一些瑕疵和不足,也就是常说的“脏”数据,这就需要对数据进行清洗。例如,对数据进行变换、降维、特征选取等操作



第 4 章

介绍 SKlearn 中常用的分 类、回 归、聚类模 型。其 中,分类模型包括

DecisionTree、Bayes、KNN、SVM; 回 归 模 型 包 括 Ridge Regression、Lasso

Regression、SVR;聚类模型包括 K-means、Spectral Clustering、Mean Shift 等

第 5 章

介绍常用的集成学习算法,包括自适应增强算法、梯度提升树、随机森林。利用集成学习算法组合多个弱监督模型,得到一个更好更全面的强监督模型



第 6 章

介绍模型评估方法及指标。分类问题中的评估指标包括准确率、精确率、召回率、

F1 值;回归问题中的评估指标包括绝对误差平均值、误差平方平均值、验证曲线、学习曲线等。在确定最优模型后,需要进一步优化模型参数,并对训练好的模型进行持久化保存

第 7 章

通过五个工程案例分析,分别系统化解析了二分类、多分类、回归、聚类算法的具体应用



机器学习实战——基于 Python SKlearn 的解析



■ 本书特点

系统:以“轻原理、重实践”为原则,详细解析机器学习库 SKlearn; 通俗:从参数调用的角度,适合零基础读者快速入门并掌握 SKlearn;

深入:由浅及深熟悉数据探索、预处理、模型选择、集成学习、模型评估流程; 案例:用五个工程案例系统化讲解 SKlearn 库分类、回归、聚类,实用性强。



■ 本书目的

希望阅读本书的读者能够掌握机器学习 SKlearn 库常用模型的调用方式,将其应用到自身行业中,创造出属于自己的研究成果。



■ 素材资源下载

由于笔者的水平有限,书中难免会出现错误或者不准确的地方,恳请读者批评指正。为此方便读者学习,本书配套资源下载。



笔者

2023 年 2 月



产品特色

编辑推荐


系统:以“轻原理、重实践”为原则,详细解析机器学习库SKlearn



通俗:从参数调用的角度,适合零基础读者快速入门并掌握SKlearn



深入:由浅及深熟悉数据探索、预处理、模型选择、集成学习、模型评估流程



案例:用五个工程案例系统化讲解SKlearn库分类、回归、聚类,让你码上就用



内容简介

本书前6章介绍基础准备、数据探索、数据预处理、机器学习模型(分类、回归、聚类)、集成学习、模型评估及持久化;第7章介绍机器学习在土木工程中的应用场景,并以五个工程案例系统化讲解SKlearn库的应用。
本书“轻原理、重实践”,适合广大对机器学习有兴趣,并且想系统学习数理统计的读者;也可用作机器学习培训、高校教材或作为学习SKlearn库的工具书。

作者简介

屈希峰,七年Python技术开发相关经验。2017年,使用Flask、MongoDB开发网站;2018年开发微信小程序:注册土木、注道、爱伴读等,其中微信小程序注册土木累计关注者1.2万人;2019年开发Windows桌面应用文字表格公式识别神器.exe,累计用户3千余人。使用Python期间,在知乎开设专栏记录经验,当前知乎关注者2.25万,其中编程专栏关注者4千余人。在工作中,探索Python编程在土木工程工程中的应用,对BIM、GIS以及数值分析软件的二次开发都有涉猎,现阶段工作重心在于如何将物联网及机器学习应用到土木行业智能检测和监测领域。

内页插图

目录

第1章 基础准备
1.1 机器学习
1.1.1 机器学习概述
1.1.2 机器学习任务
1.1.3 机器学习经验
1.1.4 机器学习性能
1.2 Python编程
1.2.1 Python
1.2.2 NumPy和SciPy
1.2.3 Matplotlib
1.2.4 Pandas
1.2.5 SKlearm
1.2.6 Yellowbrick
1.3 Python 环境配置
1.3.1 安装Anaconda
1.3.2 运行Jupyter Notebook
第2章 数据探索
2.1 数据读取和保存
2.1.1 TXT数据
2.1.2 CSV数据
2.1.3 XLS数据
2.1.4 SOL数据
2.1.5 NOSOL数据
2.2 数据特征分析
2.2.1 描述性统计
2.2.2 分布分析
2.2.3 对比分析
2.2.4 相关性分析
第3章 数据预处理
3.1 数据清洗
3.1.1 缺失值处理
3.1.2 异常值处理
3.1.3 数据一致性处理
3.2 数据变换
3.2.1 二元化
3.2.2 独热码
3.2.3 标准化
3.2.4 正则化
3.2.5 数据变换应用
3.3 数据降维
3.3.1 主成分分析
3.3.2 线性判别分析
3.3.3 多维缩放降维
3.3.4 流形学习
3.4 特征选取
3.4.1 过滤式特征选取
3.4.2 包裹式特征选取
3.4.3 嵌入式特征选取
3.5 数据降维与特征选取的差别
第4章 机器学习模型
4.1 线性模型
4.1.1 线性回归模型
4.1.2 逻辑回归模型
4.2 决策树
4.2.1 回归决策树
4.2.2 分类决策树
4.3 贝叶斯分类器
4.3.1 高斯贝叶斯分类器
4.3.2 多项式贝叶斯分类器
4.3.3 伯努利贝叶斯分类器
4.4 KNN
4.4.1 KNN分类
4.4.2 KNN回归
4.5 聚类
4.5.1 K均值聚类
4.5.2 密度聚类
4.5.3 层次聚类
4.5.4 高斯混合聚类
4.6 支持向量机
4.6.1 线性分类
4.6.2 非线性分类
4.6.3 线性回归
4.6.4 非线性回归
第5章 集成学习
5.1 常用的集成学习方法——AdaBoost
5.1.1 分类
5.1.2 回归
5.2 梯度提升树
5.2.1 GBDT算法的分类类——GradientBoostingClassifier
5.2.2 GBDT算法的回归类——GradientBoostingRegressor
5.3 随机森林
5.3.1 RandomForestClassifier模型
5.3.2 RandomForestRegressor模型
第6章 模型评估及持久化
6.1 损失函数
6.1.1 0-1损失
6.1.2 对数损失
6.2 数据切分
6.2.1 train-test-split()方法
6.2.2 KFold()方法
6.2.3 StratifiedKFold()方法
6.2.4 LeaveOneOut()方法
6.2.5 crossVal-score()方法
6.3 性能度量
6.4 参数优化
6.5 模型持久化
第7章 项目实践
7.1 工程应用场景
7.1.1 可行性研究阶段
7.1.2 设计阶段
7.1.3 施工阶段
7.1.4 监理监测
7.1.5 运营维护
7.2 边坡稳定性预测
7.2.1 数据探索
7.2.2 数据预处理
7.2.3 模型选择
7.2.4 模型评估
7.2.5 模型持久化
7.3 地质物探预测
7.3.1 数据探索
7.3.2 数据预处理
7.3.3 集成学习
7.3.4 模型评估
7.3.5 模型持久化
7.4 隧道岩爆分级预测
7.4.1 数据探索
7.4.2 数据预处理
7.4.3 集成学习
7.4.4 模型评估
7.4.5 模型持久化
7.5 混凝土强度预测
7.5.1 数据探索
7.5.2 数据预处理
7.5.3 模型选择
7.5.4 参数优化
7.5.5 模型持久化
7.6 膨胀土膨胀性等级分类
7.6.1 数据探索
7.6.2 数据预处理
7.6.3 分类簇数选择
7.6.4 模型评估
7.6.5 模型持久化

前言/序言

近些年,机器学习广泛应用于计算机、医疗、金融、智能设备等领域。目前,关于机器学习的书籍种类繁多,有科普性质的初级系列,也有深度解析原理、手写算法系列,但以工程案例为背景的系统化图书较少,尤其在土木工程等传统行业,乏善可陈;笔者查询了一些有关土木领域的科研论文及毕业论文,关于机器学习的论文数量也有限。然而公众号以及知乎上的土木同行对 Python,尤其是机器学习在行业中的应用非常期待,寄希望于降低日常重复性工作环节(诸如设计、施工、科研等)。

因此,笔者从自己熟悉的岩土领域,本着“轻原理、重实践”的原则,避开复杂的机器学习原理,从参数调用(调包)的角度,解析机器学习库 SKlearn 的常用模型。本书适合零基础的读者,以便快速入门并掌握 SKlearn 的精髓。



■ 本书构架



章名

主要内容

第 1 章

主要介绍机器学习的基本理论、相关 Python 库和必要的编程环境配置

第 2 章

介绍如何使用 Pandas 库加载数据,并对数据进行探索性分析。例如,查看数据的统计特征、分布、相关性等



第 3 章

介绍数据预处理方法。通常我们拿到的数据或多或少都存在一些瑕疵和不足,也就是常说的“脏”数据,这就需要对数据进行清洗。例如,对数据进行变换、降维、特征选取等操作



第 4 章

介绍 SKlearn 中常用的分 类、回 归、聚类模 型。其 中,分类模型包括

DecisionTree、Bayes、KNN、SVM; 回 归 模 型 包 括 Ridge Regression、Lasso

Regression、SVR;聚类模型包括 K-means、Spectral Clustering、Mean Shift 等

第 5 章

介绍常用的集成学习算法,包括自适应增强算法、梯度提升树、随机森林。利用集成学习算法组合多个弱监督模型,得到一个更好更全面的强监督模型



第 6 章

介绍模型评估方法及指标。分类问题中的评估指标包括准确率、精确率、召回率、

F1 值;回归问题中的评估指标包括绝对误差平均值、误差平方平均值、验证曲线、学习曲线等。在确定最优模型后,需要进一步优化模型参数,并对训练好的模型进行持久化保存

第 7 章

通过五个工程案例分析,分别系统化解析了二分类、多分类、回归、聚类算法的具体应用



机器学习实战——基于 Python SKlearn 的解析



■ 本书特点

系统:以“轻原理、重实践”为原则,详细解析机器学习库 SKlearn; 通俗:从参数调用的角度,适合零基础读者快速入门并掌握 SKlearn;

深入:由浅及深熟悉数据探索、预处理、模型选择、集成学习、模型评估流程; 案例:用五个工程案例系统化讲解 SKlearn 库分类、回归、聚类,实用性强。



■ 本书目的

希望阅读本书的读者能够掌握机器学习 SKlearn 库常用模型的调用方式,将其应用到自身行业中,创造出属于自己的研究成果。



■ 素材资源下载

由于笔者的水平有限,书中难免会出现错误或者不准确的地方,恳请读者批评指正。为此方便读者学习,本书配套资源下载。



笔者

2023 年 2 月