打算做几个系列文章,系统地梳理AI产品经理所需的核心知识与思维框架,帮助产品人更好地理解AI、应用AI,更从容地转型成一个懂趋势、懂技术、懂工程、懂商业落地的AI产品人。
AI技术基础原理系列主要涉及数学、ML算法、大模型、提示工程、上下文工程等内容,产品人主要是理解其中的技术原理和概念,帮助大家在实际业务中能解释应该选择什么模型、什么算法、什么上下文管理策略且能说清原因。
从人工智能说起
要了解机器学习首先从人工智能说起。因为人工智能是目标,机器学习是实现路径。
人工智能指的是让机器具备类似人类智能的能力,使其能够感知环境、学习经验、识别信息并进行推理与决策。
而机器学习(Machine Learning)是人工智能的核心方法,它让机器从有限的数据中”学习”出规律,并用这些规律对未知情况做出预测或判断。
机器学习分类
根据学习范式分类
从学习方式上看,机器学习可以分为三类:监督学习、无监督学习和强化学习。
📚 1⃣️ 监督学习
定义:模型通过大量”输入(特征)+输出(目标)”的样本,学习输入与输出之间的映射关系,然后通过映射关系对数据进行预测。
学习依赖人工标注的输出标签。目标明确,效果好衡量(准确率)。
典型应用:
- 分类、回归、目标检测、序列生成、序列标注等
常见算法:
- 回归类:线性回归、岭回归
- 分类类:逻辑回归、决策树、随机森林、支持向量机、神经网络
小结:
有老师教,学预测
🔍 2⃣️ 无监督学习
定义:模型自动从海量数据中找出潜在结构、模式或规律,无需人工标注。
学习依赖模型自己观察和学习,适用于探索性分析,重点在于”理解数据”而非”预测结果”。
典型应用:
- 聚类、异常检测、关联规则挖掘、降维
常见算法:
- 聚类:K均值聚类、层次聚类
- 降维:主成分分析(PCA)、t-SNE
- 异常检测:基于密度的异常检测、基于距离的异常检测
小结:
自己摸索,学结构
🎮 3⃣️ 强化学习
定义:智能体(Agent)在环境中行动,每个动作都会得到奖励或惩罚,目标是学习到一个能获得最大奖励的策略。
学习依赖反馈信号(reward),重点在于探索(未知领域的Exploration)和利用(已有知识的Exploitation)的平衡。
典型应用:
- 自动驾驶车辆、游戏与游戏玩家、机器人控制
常见算法:
- 值迭代法:Q-learning
- 策略梯度法:REINFORCE、PPO、DDPG、SAC
- 深度强化学习:结合神经网络的版本
小结:
边做边学,学决策
根据模型复杂度分类
除了学习范式外,机器学习还可以根据模型结构和特征表达能力分为两类:浅层学习和深度学习。
📊 1⃣️ 浅层学习
定义:也称表面学习或传统学习,主要通过构建浅层(输入层和输出层之间只有一层或很少基层隐层)、较简单的模型来进行模式识别、分类、回归等任务。
依赖人工进行特征提取来决定模型的输入,由于模型结构浅,计算很快,数据需求量也比较少。
常见算法:
| 算法 | 类型 | 特点 |
|---|---|---|
| 线性回归 / 逻辑回归 | 监督学习 | 简单、可解释,但表达能力有限 |
| 支持向量机(SVM) | 监督学习 | 在特征空间里找最优分割超平面 |
| 决策树 / 随机森林 | 监督学习 | 易解释、可处理非线性,但难应对高维复杂数据 |
| K-Means / PCA | 无监督学习 | 发现简单结构,但无法捕捉复杂特征 |
🧠 2⃣️ 深度学习
定义:使用多层神经网络(通常3层以上的隐层)来学习数据的高层次特征表示。
无需人工设计特征,通过反向传播自动从原始数据中学习特征表示(底层特征 ➡️ 中层特征 ➡️ 高层特征),需要大量数据和算力支持。
常见模型:
| 模型类型 | 应用场景 | 代表架构 |
|---|---|---|
| 卷积神经网络(CNN) | 图像识别、视频分析 | ResNet、VGG、Inception |
| 循环神经网络(RNN) | 序列数据、语音识别 | LSTM、GRU |
| Transformer | 自然语言处理、通用AI | BERT、GPT、ViT |
| 自编码器 / GAN | 表征学习、生成任务 | AE、VAE、GAN、Diffusion |
目前最前沿的AI技术的主流算法都是基于神经网络和强化学习。
监督学习
学的是”正确答案”
无监督学习
学的是”数据结构”
强化学习
学的是”决策策略”
深度学习
让机器自己学会”怎么学习”
相关词汇定义
| 词汇名称 | 定义 | 其它说明 |
|---|---|---|
| 特征 | 指从原始数据中提取出的、用于表示样本的属性或信息 | 在机器学习模型中,特征作为模型的输入,用于表示样本的不同属性,从而帮助模型进行学习和预测 |
| 特征工程 | 指在机器学习和数据挖掘中,通过对原始数据进行处理、转换和提取,生成新的特征或选择合适的特征,从而改进模型性能和提高预测准确性的过程 | 选择什么输入参数、输入多少参数给模型对模型最后的识别性能有很高的影响,挖掘和选择特征的过程就是特征工程 |
| 表示/表征 | 指将数据以某种形式进行编码或者表示的方式,可以是在特征空间或其它空间中的表示 | 在深度学习中,表征通常是模型自动学习得到的,比手工设计的特征更能捕捉数据中的复杂模式和关系,从而提升模型的性能 |
| 局部表示 | 也称离散表示或符号表示,通常可以表示为One-hot向量的形式,即在多维度的一个词表里,有且只有一个维度值为1,其它维度都为0来表示某一个词 |
优点:
不足:
|
| 分布式表示 | 将数据表示为多维向量的方法,其中每个维度都包含有关数据的一部分信息,低维的稠密向量 |
优点:
不足:
|
| 表征学习 | 通过深度神经网络等模型,自动化地从原始数据中学习有效(层次化、抽象化)的特征表示的方法,无需手工设计特征。 | 表征学习的关键是构建具有一定深度的多层次特征表示,通过深度神经网络增加特征的重用性,从而指数级地增加表示能力。 |
