《多模态数据分析:AGI时代的数据分析方法与实践》[88M]百度网盘|pdf下载|亲测有效
《多模态数据分析:AGI时代的数据分析方法与实践》[88M]百度网盘|pdf下载|亲测有效
《多模态数据分析:AGI时代的数据分析方法与实践》[88M]百度网盘|pdf下载|亲测有效
《多模态数据分析:AGI时代的数据分析方法与实践》[88M]百度网盘|pdf下载|亲测有效
《多模态数据分析:AGI时代的数据分析方法与实践》[88M]百度网盘|pdf下载|亲测有效
《多模态数据分析:AGI时代的数据分析方法与实践》[88M]百度网盘|pdf下载|亲测有效
《多模态数据分析:AGI时代的数据分析方法与实践》[88M]百度网盘|pdf下载|亲测有效
《多模态数据分析:AGI时代的数据分析方法与实践》[88M]百度网盘|pdf下载|亲测有效
《多模态数据分析:AGI时代的数据分析方法与实践》[88M]百度网盘|pdf下载|亲测有效
《多模态数据分析:AGI时代的数据分析方法与实践》[88M]百度网盘|pdf下载|亲测有效

多模态数据分析:AGI时代的数据分析方法与实践 pdf下载

isbn:9787121505904
出版社 电子工业出版社
出版年 2025-07-01
页数 390页
ISBN 9787121505904
装帧 精装
评分 9.4(豆瓣)
限时特惠 00:00:00
活动结束后恢复原价
纸质书参考价 ¥23
电子版限时价 ¥5.99 省 18 元

选择版本

不满意全额退款
发货失败双倍赔偿
邮箱即时发送

内容简介

本篇主要提供多模态数据分析:AGI时代的数据分析方法与实践电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

产品特色

编辑推荐

数据是AI的基石

多模态是通向AGI的关键

多模态数据的一切尽在本书中

从基础概念到关键技术,再到典型应用

全方位讲解多模态数据分析核心技术与前沿实践

“理论框架—技术路径—实战案例”层层递进

提供了一套完整的多模态数据分析知识链路

主体包括基于Python语言的大量实例代码

不仅让读者学以致用,还能拥有实践经验

作者拥有多年工业界大数据技术实践经验

获得业内众多专家联合力荐

既可作为数据分析师、数据科学家、数据工程师、

算法工程师等数据相关从业者的学习用书

也可作为高校数学、统计、计算机等相关专业教材

愿你在AI时代浪潮中踏浪而行

翻出属于自己的那朵美丽浪花 !


内容简介

真实世界的数据都是多模态的,真正的通用人工智能(AGI)必将超越单一模态的局限。本书基于作者多年工业界大数据技术经验,系统而全面地探讨了多模态数据技术,从基础概念到关键技术再到典型应用,全方位讲解多模态数据分析的核心技术与前沿实践。书中首先详尽介绍了多模态数据分析相关知识,涉及文本、图像、音频、视频等多模态数据;然后结合实例代码,系统介绍了统计学与数据分析、机器学习、深度学习、知识图谱、大模型等方法和模型,以及GPT与DeepSeek等大模型的多模态实践分析;最后结合医疗、直播、视频等领域的案例阐述了多模态数据分析的多种算法模型的综合应用。

本书体系化强、案例丰富,以“理论框架—技术路径—实战案例”层层递进的方式提供了完整的知识链路,主体基于Python语言的大量实例代码,可以帮助读者学以致用。

本书既可作为数据分析师、数据科学家、数据工程师、算法工程师等数据相关从业者的学习用书,也可作为高校数学、统计学、计算机等相关专业的师生用书和培训学校的教材。


作者简介

巴川,资深数据科学家,曾就职于中国搜索、搜狐畅游、竞技世界等互联网公司。主要研究领域包括数据挖掘、人工智能、知识图谱、精细化运营、风控体系等。CCF TF数据科学SIG主席,CAAI机器博弈专委会常委,曾任北京航空航天大学兼职硕导,西安交通大学研究生院授课专家,多所高校兼职授课教师、多个智库技术专家。TOP100、QCon、DataFun、DTCC、SACC、WOT、A2M、CDAS、TID、GIEC、CCF青年精英大会、中国软件技术大会、中国计算机教育大会等行业峰会演讲嘉宾及出品人。另任中国国际大学生创新大赛、CCF青年精英科技创业秀等多个创新创业大赛专家评委,多所高校创新创业导师,助力科研成果转化落地。

李慧,资深数据分析挖掘工程师,硕士毕业于北京航空航天大学,曾就职百度,任SACC、TOP100、DataFun、WOT等前沿技术大会演讲嘉宾,专注多模态数据分析领域研究,在用户增长、因果推断、数据预测等方向积累了丰富实践经验,秉持数据赋能理念,擅长驱动数据价值落地与场景化应用。

钟宇周,硕士毕业于北京大学光华管理学院,曾就职于竞技世界、阿里巴巴,目前为快手主站数据分析师,负责C端流量核心业务,擅长统计回归分析、机器学习模型预测与推断、自然语言处理技术,致力于探索技术与业务结合的多模态数据分析方法。

叶心函,资深数据分析挖掘工程师,硕士毕业于中国科学院大学,在AI、风控和知识图谱等领域有丰富的多模态数据分析经验,并且见解独特,擅长运用前沿算法和模型解决复杂数据问题,助力企业实现精准决策与高效增长。



精彩书评

在数字化时代,多模态数据以其多样性和丰富性,为解析复杂现象提供了全新的视角。《多模态数据分析》一书深入探讨了文本、图像、音频及视频等数据类型的分析策略与方法,并通过翔实的案例分析,从问题定义到代码实现,全面展示了多模态技术在医疗、直播、视频等领域的应用潜力。本书不仅为研究者和从业者提供了宝贵的知识积累,还赋予其实战技巧,是探索数据价值、驱动创新不可或缺的指南。

—塔斯汀大数据中心总经理 刘思喆

我们生活在一个多模态的世界中。对多模态数据的分析往往是决策过程中必不可少的关键环节。在《多模态数据分析》一书中,巴川等老师基于多年的工作和教学经验,全面探讨了这一领域的核心问题与解决方案,内容覆盖广泛且生动有趣。书中通过丰富的实践案例,详细讲解了各种多模态分析方法,为读者提供了宝贵的实用指导。无论是新手还是专业人士,都能从书中获得新知识和启发,提升多模态数据分析的能力。

—北京玄骥科技有限公司CEO 单艺

多模态数据是通向AGI和ASI的关键。《多模态数据分析》一书系统而全面地探讨了多模态数据技术,从基础概念到关键技术再到典型应用。作者团队基于自己多年工业界大数据分析经验,介绍了多模态数据分析技术在医疗健康、视频直播、内容创作等领域的实战案例。对于数据科学领域的研究人员、工程师和学生来说,本书是一本完整且实用的学习参考资料,能够帮助读者全方位掌握多模态数据分析的核心技术与前沿实践。

—外研在线技术副总裁 董晋鹏

作为技术人员出身的创业者,我深知实践经验的价值。本书以多模态数据为核心,解析大模型的数据应用,为读者提供有深度且实用的AI指南。书中不但有对GPT与DeepSeek等大模型的多模态实践分析,并且通过医疗诊断、用户行为分析等案例,展现了多模态数据分析的现实意义。本书内容结构严谨,语言通俗易懂,适合初学者与专业人士。愿它启发更多读者!

—Westar实验室创始人,中国计算机学会TF主席 杨卫华(Tim Yang)

多模态数据分析作为连接现实世界与人工智能的桥梁,正成为大模型时代的核心驱动力。作为长期致力于知识图谱与大模型融合研究的学者,我被这部著作的系统性与前瞻性深深折服,它为我们呈现了多模态智能的完整图景。本书从单一模态处理到跨模态融合,从统计方法到深度学习,构建了一条清晰的技术进阶路径。本书包括多个领域的实战案例,涵盖医疗疾病诊断、直播热点挖掘与优质视频创作等热点方向,展现了多模态技术的无限潜力。在数据与知识交融的新时代,这本著作既是一本入门指南,也是一本实践宝典,必将助力读者在多模态智能的探索中披荆斩棘、开辟新境。

—OpenKG首届轮值主席 王昊奋

从大数据到大模型,一个“大”字道尽玄机。巴川老师以“多模态数据”为起点,将大数据在大模型时代的应用融会贯通,为读者提供了一份完整的人工智能学习实践手册。本书不仅涵盖了AGI领域最核心的知识点,更提供了深入浅出的案例和实践代码,内容精彩、引人入胜,可以帮助读者完整地走过从数据到智能的入门之路。厚积薄发,开卷有益,祝贺这本佳作开启又一次知音之旅。

—云和恩墨创始人 盖国强

大语言模型(LLM)实现了单一模态的技术突破,推动人工智能进入新阶段。而世界上的信息、数据都是多模态的,真正的通用人工智能(AGI)必将超越语言单一模态的局限。巴川等老师的这本著作,以“理论框架—技术路径—实战案例”层层递进的方式提供了完整的知识链路。几个实战案例可谓点睛之笔,打通了多模态技术从理论到落地的“最后一公里”,生动展现了多模态技术赋能千行百业的潜力。翻开书页,未来已徐徐展开。

—公众号“IT民工闲话”作者 史海峰

在AI时代,“认知碎片”是创新最大的障碍。巴川等老师的新著以“专业实践,通俗易懂”为核心,系统构建多模态智能体系:从单模态处理到大模型应用,贯穿统计学、知识图谱等关键技术,更以实际案例印证了“数据—算法—场景”统一价值流的真谛。本书不仅破解了多模态数据融合的密码,更搭建起从理论到产业落地的桥梁。

—精益数据创始人 史凯

在多模态成为新一代基础设施的今天,新技术落地的关键在于打通“最后一公里”的工程化断层。巴川兄的《多模态数据分析》一书构建了一套完整的工程化框架,不仅系统梳理了从传统统计学到现代大模型的技术演进路径,更通过精准医疗、视频挖掘等真实场景案例,实现了从工具到应用的全链路闭环。作为工程师文化布道者,我期待更多工程师掌握这套多模态数据分析体系,共同开启数据价值的掘金时代。

—msup公司创始人兼CEO 刘付强


目录


第1章 多模态数据分析概述 1

1.1 什么是多模态数据 1

1.2 多模态数据分析的意义 4

1.3 多模态数据分析的挑战 7

1.4 小结 9

第2章 单一模态数据处理与分析 11

2.1 文本数据处理与分析 11

2.1.1 文本数据处理 12

2.1.2 文本分类与主题建模 21

2.2 图像数据处理与分析 25

2.2.1 图像数据处理 25

2.2.2 图像目标检测 35

2.3 音频数据处理与分析 37

2.3.1 音频数据预处理 38

2.3.2 音频分类与事件检测 46

2.4 视频数据处理与分析 49

2.4.1 视频数据预处理 50

2.4.2 行为识别与动作分析 60

2.5 小结 65

第3章 多模态数据融合 66

3.1 多模态数据融合的研究意义 66

3.2 多模态数据融合的常规方法 67

3.2.1 特征级融合 67

3.2.2 决策级融合 71

3.2.3 模型级融合 75

3.2.4 混合级融合 80

3.3 多模态数据融合的创新方法 84

3.3.1 基于深度学习的多模态特征自适应融合 84

3.3.2 基于跨模态语义对齐的一致性增强融合 89

3.3.3 基于图的多模态图像关系推理融合 92

3.4 小结 95

第4章 统计学与数据分析 96

4.1 统计学概述 96

4.2 基础知识 98

4.2.1 描述统计 98

4.2.2 假设检验 105

4.3 相关性分析 107

4.4 回归分析 109

4.4.1 回归分析介绍 109

4.4.2 案例:二手车怎么买 111

4.5 算法案例:基于相关性统计的短语词云 121

4.5.1 文本数据处理 121

4.5.2 短语词云算法原理与展示 125

4.6 小结 126

第5章 基于机器学习的多模态数据分析 128

5.1 经典机器学习算法介绍 128

5.1.1 线性回归 129

5.1.2 逻辑回归 130

5.1.3 支持向量机 131

5.1.4 决策树 132

5.1.5 随机森林 134

5.1.6 XGBoost 137

5.1.7 朴素贝叶斯 137

5.1.8 神经网络 138

5.2 案例:基于支持向量机的车牌识别 140

5.3 案例:基于神经网络的机器翻译 150

5.4 小结 154

第6章 基于深度学习的多模态数据分析 156

6.1 深度学习介绍 156

6.2 卷积神经网络及其数据分析案例 158

6.2.1 卷积神经网络介绍 158

6.2.2 案例:颜值评分 160

6.3 序列数据应用—LSTM 167

6.3.1 循环神经网络和LSTM介绍 167

6.3.2 案例:用模型作诗 169

6.4 深度学习扩展知识与应用 175

6.5 小结 180

第7章 基于知识图谱的多模态数据分析 181

7.1 知识图谱技术体系及其构建方法 181

7.1.1 知识图谱技术体系 181

7.1.2 案例:构建知识图谱 184

7.2 知识图谱与多模态数据融合 190

7.2.1 融合的优势及应用方向 190

7.2.2 案例:构建基于多模态知识图谱的多标签预测模型 191

7.3 知识图谱推理与分析 203

7.3.1 推理与分析方法介绍 203

7.3.2 案例:基于图神经网络的知识图谱给用户推荐电影 204

7.4 知识图谱数据分析的企业级拓展应用 208

7.4.1 用户传播路径 208

7.4.2 用户搜索观星台 209

7.4.3 用户关系网络及健康度评估 210

7.5 小结 212

第8章 基于大模型的多模态数据分析 213

8.1 大模型概述 213

8.1.1 大模型的定义与特点 213

8.1.2 大模型的基本原理 214

8.1.3 大模型在多模态数据分析中的重要作用 217

8.2 大模型应用架构 218

8.2.1 业务架构 218

8.2.2 技术架构 220

8.2.3 技术路线选择 224

8.3 大模型在多模态数据分析中的应用 226

8.3.1 大模型助力多模态数据处理 226

8.3.2 大模型助力多模态数据融合 228

8.3.3 大模型助力多模态数据分析 230

8.4 GPT与DeepSeek:多模态数据分析领域的交锋 231

8.4.1 GPT:多模态先驱,当下实力究竟几何 231

8.4.2 DeepSeek:新晋黑马,突破重围有何独特优势 233

8.4.3 巅峰对垒:GPT与DeepSeek多模态数据分析比拼 235

8.5 小结 237

第9章 实战案例:挖掘肺部病变,赋能精准医疗 239

9.1 多模态数据分析在医疗领域的发展和应用现状 239

9.2 肺部病变识别的背景介绍 241

9.3 肺部病变识别的实践过程 242

9.3.1 CT影像数据预处理 242

9.3.2 使用TensorFlow搭建CNN模型 250

9.3.3 使用模型识别疑似病灶图像 255

9.4 小结 258

第10章 实战案例:剖析疾病数据,助力早期筛查 260

10.1 疾病早筛数据预处理 260

10.2 建立重大疾病预测模型 267

10.3 疾病早筛实际业务过程和价值预估 269

10.4 小结 272

第11章 实战案例:聚焦直播高光时刻,推动话题制造 273

11.1 直播数据特点 273

11.2 直播数据反馈 274

11.3 视觉内容识别 276

11.4 弹幕评论解析 280

11.5 音频情感分析 283

11.6 协同确定直播高光时刻 286

11.7 小结 287

第12章 实战案例:解析优质视频,汲取创作灵感 288

12.1 短视频数据特点 288

12.2 使用多模态大模型做视频分析的优势和局限性 290

12.3 从视频内容预处理到灵感孵化 293

12.4 数据驱动的灵感闭环 299

12.5 小结 301


前言/序言


近十几年来,数据技术可能是这个世界上发展最快的领域。从小样本数据分析到大数据分析,从数据科学到机器学习,从人工智能到如今爆火的大模型,从单一模态数据分析到多模态数据分析,数据技术领域的从业者经历着兴奋刺激的飞速发展,同时被技术变化裹挟着不断前进。

作者十几年来与数据同行一起在纷繁的业务中翻滚,在数据的汪洋中浸泡,在复杂的职场中浮沉,深感时代洪流滔滔向前,唯一不变的只有变化,而我们面对变化、拥抱变化的方法只有不断学习,这样才能不被时代抛弃。

本书是作者十几年来与数据打交道的经验总结,里面既有概念、方法介绍,又有案例、代码实践,希望能给读者提供多模态数据分析的方法与实践经验,帮助读者在AI时代的浪潮中踏浪而行,有机会翻出属于自己的那朵小浪花。



产品特色

编辑推荐

数据是AI的基石

多模态是通向AGI的关键

多模态数据的一切尽在本书中

从基础概念到关键技术,再到典型应用

全方位讲解多模态数据分析核心技术与前沿实践

“理论框架—技术路径—实战案例”层层递进

提供了一套完整的多模态数据分析知识链路

主体包括基于Python语言的大量实例代码

不仅让读者学以致用,还能拥有实践经验

作者拥有多年工业界大数据技术实践经验

获得业内众多专家联合力荐

既可作为数据分析师、数据科学家、数据工程师、

算法工程师等数据相关从业者的学习用书

也可作为高校数学、统计、计算机等相关专业教材

愿你在AI时代浪潮中踏浪而行

翻出属于自己的那朵美丽浪花 !


内容简介

真实世界的数据都是多模态的,真正的通用人工智能(AGI)必将超越单一模态的局限。本书基于作者多年工业界大数据技术经验,系统而全面地探讨了多模态数据技术,从基础概念到关键技术再到典型应用,全方位讲解多模态数据分析的核心技术与前沿实践。书中首先详尽介绍了多模态数据分析相关知识,涉及文本、图像、音频、视频等多模态数据;然后结合实例代码,系统介绍了统计学与数据分析、机器学习、深度学习、知识图谱、大模型等方法和模型,以及GPT与DeepSeek等大模型的多模态实践分析;最后结合医疗、直播、视频等领域的案例阐述了多模态数据分析的多种算法模型的综合应用。

本书体系化强、案例丰富,以“理论框架—技术路径—实战案例”层层递进的方式提供了完整的知识链路,主体基于Python语言的大量实例代码,可以帮助读者学以致用。

本书既可作为数据分析师、数据科学家、数据工程师、算法工程师等数据相关从业者的学习用书,也可作为高校数学、统计学、计算机等相关专业的师生用书和培训学校的教材。


作者简介

巴川,资深数据科学家,曾就职于中国搜索、搜狐畅游、竞技世界等互联网公司。主要研究领域包括数据挖掘、人工智能、知识图谱、精细化运营、风控体系等。CCF TF数据科学SIG主席,CAAI机器博弈专委会常委,曾任北京航空航天大学兼职硕导,西安交通大学研究生院授课专家,多所高校兼职授课教师、多个智库技术专家。TOP100、QCon、DataFun、DTCC、SACC、WOT、A2M、CDAS、TID、GIEC、CCF青年精英大会、中国软件技术大会、中国计算机教育大会等行业峰会演讲嘉宾及出品人。另任中国国际大学生创新大赛、CCF青年精英科技创业秀等多个创新创业大赛专家评委,多所高校创新创业导师,助力科研成果转化落地。

李慧,资深数据分析挖掘工程师,硕士毕业于北京航空航天大学,曾就职百度,任SACC、TOP100、DataFun、WOT等前沿技术大会演讲嘉宾,专注多模态数据分析领域研究,在用户增长、因果推断、数据预测等方向积累了丰富实践经验,秉持数据赋能理念,擅长驱动数据价值落地与场景化应用。

钟宇周,硕士毕业于北京大学光华管理学院,曾就职于竞技世界、阿里巴巴,目前为快手主站数据分析师,负责C端流量核心业务,擅长统计回归分析、机器学习模型预测与推断、自然语言处理技术,致力于探索技术与业务结合的多模态数据分析方法。

叶心函,资深数据分析挖掘工程师,硕士毕业于中国科学院大学,在AI、风控和知识图谱等领域有丰富的多模态数据分析经验,并且见解独特,擅长运用前沿算法和模型解决复杂数据问题,助力企业实现精准决策与高效增长。



精彩书评

在数字化时代,多模态数据以其多样性和丰富性,为解析复杂现象提供了全新的视角。《多模态数据分析》一书深入探讨了文本、图像、音频及视频等数据类型的分析策略与方法,并通过翔实的案例分析,从问题定义到代码实现,全面展示了多模态技术在医疗、直播、视频等领域的应用潜力。本书不仅为研究者和从业者提供了宝贵的知识积累,还赋予其实战技巧,是探索数据价值、驱动创新不可或缺的指南。

—塔斯汀大数据中心总经理 刘思喆

我们生活在一个多模态的世界中。对多模态数据的分析往往是决策过程中必不可少的关键环节。在《多模态数据分析》一书中,巴川等老师基于多年的工作和教学经验,全面探讨了这一领域的核心问题与解决方案,内容覆盖广泛且生动有趣。书中通过丰富的实践案例,详细讲解了各种多模态分析方法,为读者提供了宝贵的实用指导。无论是新手还是专业人士,都能从书中获得新知识和启发,提升多模态数据分析的能力。

—北京玄骥科技有限公司CEO 单艺

多模态数据是通向AGI和ASI的关键。《多模态数据分析》一书系统而全面地探讨了多模态数据技术,从基础概念到关键技术再到典型应用。作者团队基于自己多年工业界大数据分析经验,介绍了多模态数据分析技术在医疗健康、视频直播、内容创作等领域的实战案例。对于数据科学领域的研究人员、工程师和学生来说,本书是一本完整且实用的学习参考资料,能够帮助读者全方位掌握多模态数据分析的核心技术与前沿实践。

—外研在线技术副总裁 董晋鹏

作为技术人员出身的创业者,我深知实践经验的价值。本书以多模态数据为核心,解析大模型的数据应用,为读者提供有深度且实用的AI指南。书中不但有对GPT与DeepSeek等大模型的多模态实践分析,并且通过医疗诊断、用户行为分析等案例,展现了多模态数据分析的现实意义。本书内容结构严谨,语言通俗易懂,适合初学者与专业人士。愿它启发更多读者!

—Westar实验室创始人,中国计算机学会TF主席 杨卫华(Tim Yang)

多模态数据分析作为连接现实世界与人工智能的桥梁,正成为大模型时代的核心驱动力。作为长期致力于知识图谱与大模型融合研究的学者,我被这部著作的系统性与前瞻性深深折服,它为我们呈现了多模态智能的完整图景。本书从单一模态处理到跨模态融合,从统计方法到深度学习,构建了一条清晰的技术进阶路径。本书包括多个领域的实战案例,涵盖医疗疾病诊断、直播热点挖掘与优质视频创作等热点方向,展现了多模态技术的无限潜力。在数据与知识交融的新时代,这本著作既是一本入门指南,也是一本实践宝典,必将助力读者在多模态智能的探索中披荆斩棘、开辟新境。

—OpenKG首届轮值主席 王昊奋

从大数据到大模型,一个“大”字道尽玄机。巴川老师以“多模态数据”为起点,将大数据在大模型时代的应用融会贯通,为读者提供了一份完整的人工智能学习实践手册。本书不仅涵盖了AGI领域最核心的知识点,更提供了深入浅出的案例和实践代码,内容精彩、引人入胜,可以帮助读者完整地走过从数据到智能的入门之路。厚积薄发,开卷有益,祝贺这本佳作开启又一次知音之旅。

—云和恩墨创始人 盖国强

大语言模型(LLM)实现了单一模态的技术突破,推动人工智能进入新阶段。而世界上的信息、数据都是多模态的,真正的通用人工智能(AGI)必将超越语言单一模态的局限。巴川等老师的这本著作,以“理论框架—技术路径—实战案例”层层递进的方式提供了完整的知识链路。几个实战案例可谓点睛之笔,打通了多模态技术从理论到落地的“最后一公里”,生动展现了多模态技术赋能千行百业的潜力。翻开书页,未来已徐徐展开。

—公众号“IT民工闲话”作者 史海峰

在AI时代,“认知碎片”是创新最大的障碍。巴川等老师的新著以“专业实践,通俗易懂”为核心,系统构建多模态智能体系:从单模态处理到大模型应用,贯穿统计学、知识图谱等关键技术,更以实际案例印证了“数据—算法—场景”统一价值流的真谛。本书不仅破解了多模态数据融合的密码,更搭建起从理论到产业落地的桥梁。

—精益数据创始人 史凯

在多模态成为新一代基础设施的今天,新技术落地的关键在于打通“最后一公里”的工程化断层。巴川兄的《多模态数据分析》一书构建了一套完整的工程化框架,不仅系统梳理了从传统统计学到现代大模型的技术演进路径,更通过精准医疗、视频挖掘等真实场景案例,实现了从工具到应用的全链路闭环。作为工程师文化布道者,我期待更多工程师掌握这套多模态数据分析体系,共同开启数据价值的掘金时代。

—msup公司创始人兼CEO 刘付强


目录


第1章 多模态数据分析概述 1

1.1 什么是多模态数据 1

1.2 多模态数据分析的意义 4

1.3 多模态数据分析的挑战 7

1.4 小结 9

第2章 单一模态数据处理与分析 11

2.1 文本数据处理与分析 11

2.1.1 文本数据处理 12

2.1.2 文本分类与主题建模 21

2.2 图像数据处理与分析 25

2.2.1 图像数据处理 25

2.2.2 图像目标检测 35

2.3 音频数据处理与分析 37

2.3.1 音频数据预处理 38

2.3.2 音频分类与事件检测 46

2.4 视频数据处理与分析 49

2.4.1 视频数据预处理 50

2.4.2 行为识别与动作分析 60

2.5 小结 65

第3章 多模态数据融合 66

3.1 多模态数据融合的研究意义 66

3.2 多模态数据融合的常规方法 67

3.2.1 特征级融合 67

3.2.2 决策级融合 71

3.2.3 模型级融合 75

3.2.4 混合级融合 80

3.3 多模态数据融合的创新方法 84

3.3.1 基于深度学习的多模态特征自适应融合 84

3.3.2 基于跨模态语义对齐的一致性增强融合 89

3.3.3 基于图的多模态图像关系推理融合 92

3.4 小结 95

第4章 统计学与数据分析 96

4.1 统计学概述 96

4.2 基础知识 98

4.2.1 描述统计 98

4.2.2 假设检验 105

4.3 相关性分析 107

4.4 回归分析 109

4.4.1 回归分析介绍 109

4.4.2 案例:二手车怎么买 111

4.5 算法案例:基于相关性统计的短语词云 121

4.5.1 文本数据处理 121

4.5.2 短语词云算法原理与展示 125

4.6 小结 126

第5章 基于机器学习的多模态数据分析 128

5.1 经典机器学习算法介绍 128

5.1.1 线性回归 129

5.1.2 逻辑回归 130

5.1.3 支持向量机 131

5.1.4 决策树 132

5.1.5 随机森林 134

5.1.6 XGBoost 137

5.1.7 朴素贝叶斯 137

5.1.8 神经网络 138

5.2 案例:基于支持向量机的车牌识别 140

5.3 案例:基于神经网络的机器翻译 150

5.4 小结 154

第6章 基于深度学习的多模态数据分析 156

6.1 深度学习介绍 156

6.2 卷积神经网络及其数据分析案例 158

6.2.1 卷积神经网络介绍 158

6.2.2 案例:颜值评分 160

6.3 序列数据应用—LSTM 167

6.3.1 循环神经网络和LSTM介绍 167

6.3.2 案例:用模型作诗 169

6.4 深度学习扩展知识与应用 175

6.5 小结 180

第7章 基于知识图谱的多模态数据分析 181

7.1 知识图谱技术体系及其构建方法 181

7.1.1 知识图谱技术体系 181

7.1.2 案例:构建知识图谱 184

7.2 知识图谱与多模态数据融合 190

7.2.1 融合的优势及应用方向 190

7.2.2 案例:构建基于多模态知识图谱的多标签预测模型 191

7.3 知识图谱推理与分析 203

7.3.1 推理与分析方法介绍 203

7.3.2 案例:基于图神经网络的知识图谱给用户推荐电影 204

7.4 知识图谱数据分析的企业级拓展应用 208

7.4.1 用户传播路径 208

7.4.2 用户搜索观星台 209

7.4.3 用户关系网络及健康度评估 210

7.5 小结 212

第8章 基于大模型的多模态数据分析 213

8.1 大模型概述 213

8.1.1 大模型的定义与特点 213

8.1.2 大模型的基本原理 214

8.1.3 大模型在多模态数据分析中的重要作用 217

8.2 大模型应用架构 218

8.2.1 业务架构 218

8.2.2 技术架构 220

8.2.3 技术路线选择 224

8.3 大模型在多模态数据分析中的应用 226

8.3.1 大模型助力多模态数据处理 226

8.3.2 大模型助力多模态数据融合 228

8.3.3 大模型助力多模态数据分析 230

8.4 GPT与DeepSeek:多模态数据分析领域的交锋 231

8.4.1 GPT:多模态先驱,当下实力究竟几何 231

8.4.2 DeepSeek:新晋黑马,突破重围有何独特优势 233

8.4.3 巅峰对垒:GPT与DeepSeek多模态数据分析比拼 235

8.5 小结 237

第9章 实战案例:挖掘肺部病变,赋能精准医疗 239

9.1 多模态数据分析在医疗领域的发展和应用现状 239

9.2 肺部病变识别的背景介绍 241

9.3 肺部病变识别的实践过程 242

9.3.1 CT影像数据预处理 242

9.3.2 使用TensorFlow搭建CNN模型 250

9.3.3 使用模型识别疑似病灶图像 255

9.4 小结 258

第10章 实战案例:剖析疾病数据,助力早期筛查 260

10.1 疾病早筛数据预处理 260

10.2 建立重大疾病预测模型 267

10.3 疾病早筛实际业务过程和价值预估 269

10.4 小结 272

第11章 实战案例:聚焦直播高光时刻,推动话题制造 273

11.1 直播数据特点 273

11.2 直播数据反馈 274

11.3 视觉内容识别 276

11.4 弹幕评论解析 280

11.5 音频情感分析 283

11.6 协同确定直播高光时刻 286

11.7 小结 287

第12章 实战案例:解析优质视频,汲取创作灵感 288

12.1 短视频数据特点 288

12.2 使用多模态大模型做视频分析的优势和局限性 290

12.3 从视频内容预处理到灵感孵化 293

12.4 数据驱动的灵感闭环 299

12.5 小结 301


前言/序言


近十几年来,数据技术可能是这个世界上发展最快的领域。从小样本数据分析到大数据分析,从数据科学到机器学习,从人工智能到如今爆火的大模型,从单一模态数据分析到多模态数据分析,数据技术领域的从业者经历着兴奋刺激的飞速发展,同时被技术变化裹挟着不断前进。

作者十几年来与数据同行一起在纷繁的业务中翻滚,在数据的汪洋中浸泡,在复杂的职场中浮沉,深感时代洪流滔滔向前,唯一不变的只有变化,而我们面对变化、拥抱变化的方法只有不断学习,这样才能不被时代抛弃。

本书是作者十几年来与数据打交道的经验总结,里面既有概念、方法介绍,又有案例、代码实践,希望能给读者提供多模态数据分析的方法与实践经验,帮助读者在AI时代的浪潮中踏浪而行,有机会翻出属于自己的那朵小浪花。