AI技术基础原理|机器学习基础

打算做几个系列文章,系统地梳理AI产品经理所需的核心知识与思维框架,帮助产品人更好地理解AI、应用AI,更从容地转型成一个懂趋势、懂技术、懂工程、懂商业落地的AI产品人。

AI技术基础原理系列主要涉及数学、ML算法、大模型、提示工程、上下文工程等内容,产品人主要是理解其中的技术原理和概念,帮助大家在实际业务中能解释应该选择什么模型、什么算法、什么上下文管理策略且能说清原因。

从人工智能说起

要了解机器学习首先从人工智能说起。因为人工智能是目标,机器学习是实现路径。

人工智能指的是让机器具备类似人类智能的能力,使其能够感知环境、学习经验、识别信息并进行推理与决策。

机器学习(Machine Learning)是人工智能的核心方法,它让机器从有限的数据中”学习”出规律,并用这些规律对未知情况做出预测或判断。

关系图

机器学习分类

根据学习范式分类

从学习方式上看,机器学习可以分为三类:监督学习、无监督学习和强化学习。

📚 1⃣️ 监督学习

定义:模型通过大量”输入(特征)+输出(目标)”的样本,学习输入与输出之间的映射关系,然后通过映射关系对数据进行预测。

学习依赖人工标注的输出标签。目标明确,效果好衡量(准确率)。

有监督学习

典型应用:

  • 分类、回归、目标检测、序列生成、序列标注等

常见算法:

  • 回归类:线性回归、岭回归
  • 分类类:逻辑回归、决策树、随机森林、支持向量机、神经网络

小结:

有老师教,学预测

🔍 2⃣️ 无监督学习

定义:模型自动从海量数据中找出潜在结构、模式或规律,无需人工标注。

学习依赖模型自己观察和学习,适用于探索性分析,重点在于”理解数据”而非”预测结果”。

无监督学习

典型应用:

  • 聚类、异常检测、关联规则挖掘、降维

常见算法:

  • 聚类:K均值聚类、层次聚类
  • 降维:主成分分析(PCA)、t-SNE
  • 异常检测:基于密度的异常检测、基于距离的异常检测

小结:

自己摸索,学结构

🎮 3⃣️ 强化学习

定义:智能体(Agent)在环境中行动,每个动作都会得到奖励或惩罚,目标是学习到一个能获得最大奖励的策略。

学习依赖反馈信号(reward),重点在于探索(未知领域的Exploration)和利用(已有知识的Exploitation)的平衡。

强化学习

典型应用:

  • 自动驾驶车辆、游戏与游戏玩家、机器人控制

常见算法:

  • 值迭代法:Q-learning
  • 策略梯度法:REINFORCE、PPO、DDPG、SAC
  • 深度强化学习:结合神经网络的版本

小结:

边做边学,学决策

特征 监督学习 无监督学习 强化学习
是否有标签 ✅ 有 ❌ 无 ⚙️ 奖励反馈
学习目标 学习输入→输出映射 发现数据结构 学习最优行为策略
数据来源 标注数据集 未标注数据集 与环境交互
应用场景 分类、回归 聚类、降维 游戏AI、机器人、推荐系统
学习方式 静态学习 静态学习 动态交互式学习

根据模型复杂度分类

除了学习范式外,机器学习还可以根据模型结构和特征表达能力分为两类:浅层学习深度学习

📊 1⃣️ 浅层学习

定义:也称表面学习或传统学习,主要通过构建浅层(输入层和输出层之间只有一层或很少基层隐层)、较简单的模型来进行模式识别、分类、回归等任务。

依赖人工进行特征提取来决定模型的输入,由于模型结构浅,计算很快,数据需求量也比较少。

浅层学习

常见算法:

算法 类型 特点
线性回归 / 逻辑回归 监督学习 简单、可解释,但表达能力有限
支持向量机(SVM) 监督学习 在特征空间里找最优分割超平面
决策树 / 随机森林 监督学习 易解释、可处理非线性,但难应对高维复杂数据
K-Means / PCA 无监督学习 发现简单结构,但无法捕捉复杂特征

🧠 2⃣️ 深度学习

定义:使用多层神经网络(通常3层以上的隐层)来学习数据的高层次特征表示。

无需人工设计特征,通过反向传播自动从原始数据中学习特征表示(底层特征 ➡️ 中层特征 ➡️ 高层特征),需要大量数据和算力支持。

深度学习

常见模型:

模型类型 应用场景 代表架构
卷积神经网络(CNN) 图像识别、视频分析 ResNet、VGG、Inception
循环神经网络(RNN) 序列数据、语音识别 LSTM、GRU
Transformer 自然语言处理、通用AI BERT、GPT、ViT
自编码器 / GAN 表征学习、生成任务 AE、VAE、GAN、Diffusion

对比图

目前最前沿的AI技术的主流算法都是基于神经网络和强化学习。

监督学习

学的是”正确答案”

无监督学习

学的是”数据结构”

强化学习

学的是”决策策略”

深度学习

让机器自己学会”怎么学习”

相关词汇定义

词汇名称 定义 其它说明
特征 指从原始数据中提取出的、用于表示样本的属性或信息 在机器学习模型中,特征作为模型的输入,用于表示样本的不同属性,从而帮助模型进行学习和预测
特征工程 指在机器学习和数据挖掘中,通过对原始数据进行处理、转换和提取,生成新的特征或选择合适的特征,从而改进模型性能和提高预测准确性的过程 选择什么输入参数、输入多少参数给模型对模型最后的识别性能有很高的影响,挖掘和选择特征的过程就是特征工程
表示/表征 指将数据以某种形式进行编码或者表示的方式,可以是在特征空间或其它空间中的表示 在深度学习中,表征通常是模型自动学习得到的,比手工设计的特征更能捕捉数据中的复杂模式和关系,从而提升模型的性能
局部表示 也称离散表示或符号表示,通常可以表示为One-hot向量的形式,即在多维度的一个词表里,有且只有一个维度值为1,其它维度都为0来表示某一个词 优点:

  • 解释性好(某个维度值为1即为该词),利于人工归纳和总结特征,通过特征组合可以进行高效的特征工程;
  • 稀疏向量,用于线形模型时计算效率非常高;

不足:

  • 维度数爆炸,扩展即增加维度;
  • 所有向量正交,数据之间的相似度为0
分布式表示 将数据表示为多维向量的方法,其中每个维度都包含有关数据的一部分信息,低维的稠密向量 优点:

  • 能更好捕捉数据的多样性,能处理未知数据;
  • 可以通过余弦相似度/欧式距离等计算相似度;

不足:

  • 比较吃计算性能;
表征学习 通过深度神经网络等模型,自动化地从原始数据中学习有效(层次化、抽象化)的特征表示的方法,无需手工设计特征。 表征学习的关键是构建具有一定深度的多层次特征表示,通过深度神经网络增加特征的重用性,从而指数级地增加表示能力。


留下评论

您的邮箱地址不会被公开。 必填项已用 * 标注