
深入浅出人工智能:AI入门的第一本书
书籍简介
《深入浅出人工智能:AI入门的第一本书》是一本面向人工智能(AI)初学者的科普读物,旨在用通俗易懂的语言,从初中数学出发,逐步引导读者理解人工智能的基本概念、核心技术与应用。本书不仅介绍了人工智能的基础理论,还结合了大量生活化的案例,帮助读者在轻松的氛围中掌握AI的核心知识。
本书分为四大部分,涵盖了人工智能的基础知识、底层逻辑、模型架构以及对人工智能的冷静思考。通过本书,读者可以了解机器学习、神经网络、卷积神经网络(CNN)、生成式对抗网络(GAN)、Transformer 架构、扩散模型等主流AI技术,同时也能深入思考人工智能与人类社会的关系。
本书以“从零开始”的方式引导读者进入人工智能的世界。作者通过生活化的比喻(如“追求女神”、“模仿莎士比亚写作”、“识别6岁孩子写的数字”)让复杂的AI概念变得生动有趣,帮助读者轻松理解抽象的数学公式和算法逻辑。
全书不仅涵盖了机器学习、深度学习、神经网络等核心技术,还详细解析了当前最前沿的模型,如Transformer、Stable Diffusion、GAN、Sora等,并通过实战案例(如使用Python搭建AI模型、使用RAG和LangChain构建客服机器人)帮助读者将理论知识转化为实际技能。
此外,书中还探讨了人工智能与人类社会的关系,包括AI伦理、意识问题、技术对社会的冲击等,引导读者从多个维度思考AI的未来。
图书目录
第1篇 每个人都能懂的人工智能
第1章 人工智能很简单—从初中数学到专家系统
1.1 用初中数学知识来理解人工智能
1.2 人工智能四大基础心法
1.3 追求女神这件事,技术宅男搞不定
1.4 同样是尬聊,带点智慧结果就不一样了
1.5 专家系统—追女仔,我们是专业的
第2章 机器学习是实现人工智能的必经之路
2.3.1 有监督学习—给出标准答案的学习
2.3.2 无监督学习—“别人家的孩子”
2.3.3 强化学习—真的学霸,能自己探索最优策略
2.1 机器能帮我们做什么
2.2 机器学习修炼手册
2.3 来来来,围观人家机器是怎么学习的
2.4 认识几个专业术语—AI界的“切口”
第2篇 人工智能的底层逻辑
第3章 风起云涌的人工智能战国时代
3.8.1 20分钟搭建Python环境
3.8.2 线性回归—预测鸢尾花的花瓣宽度
3.8.3 逻辑回归—泰坦尼克号乘客的幸存概率
3.8.4 K近邻—给电影分类
3.8.5 支持向量机—判断真正购买的客户
3.8.6 决策树模型—判断能否获得贷款
3.6.1 线性可分问题—楚河汉界
3.6.2 线性不可分问题—靠穿越能解决的都不叫事儿
3.6.3 多分类问题—笨人也有笨办法
3.5.1 用决策树选出心中的女神
3.5.2 ID3、C4.5和CART算法—不断提高决策的效率
3.5.3 解决过拟合问题—剪枝
3.5.4 随机森林—借助现场观众的智慧
3.2.1 线性回归—做股市里最靓的仔
3.2.2 套索回归&岭回归—线性回归的改良版
3.3.3 让损失函数最小化的方法—梯度下降
3.1 一个神族和人族的赌局
3.2 回归预测—未卜先知不是梦
3.3 逻辑回归—1912年4月15日
3.4 K近邻—圈子对了,事就成了
3.5 决策树—选择比努力更重要?
3.6 支持向量机—人脸识别的利器
3.7 朴素贝叶斯算法—买彩票走向人生巅峰
3.8 算法实战—用人工智能解决实际问题
第4章 神经网络的崛起—不是老夫离不开江湖,而是江湖离不开老夫
4.5.1 预训练—培养一位合格的运动员
4.5.2 微调—为具体比赛做准备
4.5.3 对齐—查缺补漏
4.3.1 狮驼岭的“妖怪神经网络”
4.3.2 国有国法,妖有妖规
4.3.3 模式识别—狮驼岭基本法
4.1 最简单的神经元—大道至简
4.2 加层—神经网络的曲折成佛之路
4.3 神经网络工作的基本原理—大王让我来巡山
4.4 神经网络 vs 传统机器学习
4.5 深度机器学习的三大步骤—大模型是怎么炼成的
4.6 人工智能科技树回顾
4.7 神经网络实战—让MLP识别6岁孩子写的数字
第3篇 煮酒论模型
第5章 卷积神经网络(CNN)—图像识别背后的技术
5.1 卷积,卷的是什么?
5.2 用卷积核提取喵星人的特征
5.3 猜错了怎么办?—知错就改,不断进步
5.4 神秘的神经网络—人类无法理解的黑箱
5.5 CNN实战—让机器能识别飞机、汽车、猫和狗
第6章 生成式对抗网络(GAN)—魔高一尺,道高一丈
6.1.1 生成器—字画伪造者
6.1.2 判别器—字画鉴定师
6.1 两个玩家的博弈—生成器和判别器
6.2 多轮“博弈”和“进化”
6.3 要注意的细节
第7章 扩散模型(Diffusion Model)—文字生图
7.4.1 Stable Diffusion架构—SD魔法箱里的三件法宝
7.4.2 训练U-Net去除噪声—培训一位合格的雕刻家
7.4.3 基于CLIP模型创作图像—既懂文字又懂图像的专家
7.3.1 扩散模型的灵感—覆水可收
7.3.2 从后验概率到DDPM—降低生成图像的难度
7.3.3 基于高斯分布预测噪声—另一种方式实现熵减
7.1 读心术—女神心里的“520”
7.2 从GAN到VAE — “左右手互搏” vs “经脉逆转”
7.3 扩散模型—越来越火爆的江湖绝技
7.4 Stable Diffusion—文生图的首选
第8章 机器翻译,想说爱你不容易
8.4.1 注意力不集中,送分题秒变送命题
8.4.2 Transformer—AI界的“九阴真经”
8.4.3 编码器-解码器(Encoder-Decoder)架构
8.4.4 Transformer的秘密—3个神秘矩阵wq、wk、wv
8.4.5 自注意力的计算方法
8.4.6 点乘运算—精确计算两个词语之间的亲密程度
8.4.7 多头注意力—同时关注多个特征
8.4.8 “注意力”与“自注意力”的区别
8.4.9 位置编码—解决语序问题
8.4.10 掩码—训练的时候不能偷看答案
8.3.1 化整为零—让“结巴”来识文断句
8.3.2 向量—硅基生命理解世界的方式
8.3.3 语言向量化的利器—Word2Vec
8.3.4 词向量小结
8.1 机翻毁一生
8.2 让机器翻译变得丝滑的奥秘—训练,不断地训练
8.3 单词向量化—编制一个单词向量大辞典
8.4 理解一段话的重点—你得品,细细地品
8.5 Transformer原理小结
8.6 单词向量化实战—用“结巴分词”划分token
第9章 自然语言处理的那些事—神经网络语言模型的前世今生
9.7.1 “长依赖”问题—太长的句子谁都记不住啊
9.7.2 LSTM的门控机制—脑海中的橡皮擦
9.5.1 前馈神经网络基本概念
9.5.2 怎样训练前馈神经网络
9.5.3 GPT的参数个数—1750亿个
9.5.4 神经网络怎么看懂人话—每层都有自己的任务
9.5.5 基于计数的词向量生成—越过山丘,才发现无人等候
9.5.6 基于推理实现词向量生成—欲利其器,先明其理
9.5.7 词与词之间的奇妙关系
9.5.8 词的意义取决于上下文
9.1 为什么自然语言处理是人工智能领域的一颗明珠
9.2 机器是如何理解自然语言的
9.3 暴力穷举的语言模型—用尽全宇宙的原子也无法存储的信息量
9.4 基于统计的语言模型—“床前明菠萝”?
9.5 前馈神经网络(FNN)—从最基础的讲起
9.6 循环神经网络模型(RNN)—不忘过往,面向未来
9.7 长短期记忆神经网络(LSTM)—成熟就是学会遗忘
9.8 双向RNN—像诺兰一样思考
9.9 Seq2Seq—现实世界在模型中的体现
9.10 RNN实战—模仿莎士比亚写作
第10章 Transformer架构解密—AIGC的核心技术
10.5.1 RAG基本原理—一个专业的“知识外挂”
10.5.2 LangChain简介
10.2.1 编码器(Encoder)—用庖丁解牛的方式解读文字
10.2.2 解码器(Decoder)—充满智慧的讲述者
10.2.3 嵌入层&位置编码—从自然语言到机器向量
10.2.4 输出层—从机器向量回到自然语言
10.1 注意力机制—一个字一个字地复述
10.2 从架构上再次解析Transformer—变形的秘密
10.3 Transformer 的训练过程
10.4 Transformer 的推理过程
10.5 让大模型懂你—利用大模型推理能力解决自己的问题
10.6 大模型用法实战—RAG+LangChain实现客服机器人
第11章 Sora原理解密—物理世界的模拟器?
11.2.1 图片连播就是视频—《大闹天宫》的原理
11.2.2 视频内容的整体训练—短视频的生成
11.2.3 基于Patches训练长视频—Sora的训练过程
11.2.4 根据指令生成视频—Sora的推理过程
11.1 Sora凭什么吓了世界一跳?
11.2 Sora的实现原理—Transformer+Diffusion
11.3 Sora真的模拟了这个物理世界吗?
第4篇 对人工智能的冷静思考
第12章 人工智能的江湖八卦—在关键转折点的选择
12.1 论Transformer的发家史—无心插柳柳成荫
12.2 BERT vs GPT—Transformer两大发展方向
12.3 为什么ChatGPT可以技惊四座
12.4 LLaMA—大羊驼的传奇
第13章 人工智能是否能产生意识—人与机器的分界线
13.1 一道经典的人工智能测试题
13.2 对人工智能的官方测评—155页的变态测试报告
13.3 对人工智能的民间测评—有本事就参加高考
13.4 机器是如何“思考”的?
13.5 奇点,涌现
13.6 什么是意识?
第14章 谁是洗牌人,谁是被洗的牌?
14.1 “人工智能+”
14.2 AI正在颠覆世界,是生存危机,还是泼天富贵?
14.3 时代的一粒灰,落在每个人的肩头就是一座大山
14.4 从恐惧到了解,从了解到掌握
14.5 人类智慧与人工智能
参考文献
适合人群
本书适合以下人群阅读:
AI初学者:希望从零开始了解人工智能的读者。
学生群体:尤其是对计算机科学、数据科学、机器学习感兴趣的学生。
技术人员:希望提升AI技能、了解前沿技术的开发者。
教育工作者:希望将AI知识融入教学的教师。
企业管理者:希望了解AI如何影响行业和企业发展的决策者。
普通读者:对人工智能感兴趣,但没有技术背景的读者。
推荐理由
语言通俗易懂:用生活化语言解释复杂概念,避免枯燥的数学推导,适合零基础读者入门。
内容系统全面:涵盖人工智能从基础理论到前沿技术的完整知识体系。
实战性强:提供多个Python实战案例,帮助读者动手实践,提升实战能力。
结构清晰,层次分明:章节安排合理,逻辑清晰,便于系统学习。
结合现实与未来:不仅讲解技术,还探讨AI对社会、伦理、人类意识的影响。
图文并茂:书中配有大量示意图、流程图,增强理解力。
总结
《深入浅出人工智能:AI入门的第一本书》是一本兼具可读性与实用性的人工智能入门书籍。无论你是学生、技术人员,还是对AI感兴趣的普通读者,都能从这本书中获得启发和成长。它不仅是一本技术书籍,更是一本引导你思考未来世界的读物。如果你正在寻找一本能够带你轻松入门人工智能的书,那么这本书无疑是你的理想之选。
购买此书
前往购买版权及免责申明:本文由@人工智能研究所原创发布。该文章观点仅代表作者本人,不代表本站立场。本站不承担任何相关法律责任。
如若转载,请注明出处:https://www.aipuzi.cn/ai-books/4.html