博客
关于我
机器学习---一 基本概念及入门和线性回归
阅读量:593 次
发布时间:2019-03-11

本文共 1550 字,大约阅读时间需要 5 分钟。

人工智能概述与基本概念

人工智能(Artificial Intelligence, AI)可以被理解为研究和开发能够智能地行为的计算机系统。与生物智能(如人类智能)不同,AI的核心在于模拟人类智能的某些方面,目前主要集中在计算机领域。我认为AI的发展可能会逐渐影响更多人的生活,但目前它仍然主要局限于高知识人才的学习范围。尽管如此,我也注意到AI的门槛正逐渐降低,随着越来越多人接触和学习AI知识,"全民AI"的趋势是不可忽视的。

AI的官方定义为:研究那些能够智能地行为的计算机系统的领域。这意味着AI系统需要具备与人类相当的决策能力和行为表现力。相比之下,机器学习(Machine Learning, ML)是AI的一个子领域,主要专注于数据驱动的学习过程。

AI的发展方向可以分为以下几个方面:

  • 认知类 AI:模仿人类的认知过程,包括记忆、推理和学习。
  • 理性基 riot intelligence:设计能够自主决策并处理复杂任务的AI系统。
  • 目前,社会对AI的期望主要集中于后者,以提高生产力和生活质量。例如,自主驾驶、智能助手和自动化决策系统等应用。

    1. 基本概念解读

    1.1 监督学习与无监督学习

    监督学习(Supervised Learning, SL)与无监督学习(Unsupervised Learning, UL)是机器学习中两大主要类型的区别在于数据是否带标签。

    • 监督学习:基于标签的数据集(D = (X, y)),模型学习特征 X 与标签 y 之间的关系。
    • 无监督学习:仅基于特征数据集(D = (X)),通过聚类等方法发现数据内的潜在结构或模式。

    1.2 回归与分类问题

    • 回归问题:目标输出为连续性值(如温度、身高)。
    • 分类问题:目标输出为定性值(如阴晴天、性别、图像识别)。

    两者的主要区别在于输出形式,但没有固有上的大小关系。

    1.3 数据特征与标签

    • 特征:输入数据中的属性,例如颜色、尺寸、温度等。
    • 标签:关联特征的输出属性,例如物体分类、情感分析等。
    • 样本:特征加标签的结合体,每个样本的大小等于标签的数量。

    1.4 训练与测试数据

    在机器学习任务中,数据通常分为训练集和测试集。训练集用于模型训练和参数优化,测试集用于验证模型的泛化能力。

    1.5 机器学习建模流程

    机器学习的核心流程包括:

  • 数据源
  • 数据预处理
  • 特征工程
  • 模型构建
  • 模型验证
  • 特别是在数据预处理和特征工程阶段,通常会花费大量时间提取重要特征。完成特征工程后,特征会被转换为张量形式以备模型输入。

    2. 实战阶段

    2.1 线性回归模型

    线性回归模型通过拟合一条直线来预测目标变量。其核心是确定输入特征与输出值之间的线性关系。图1展示了一条典型的线性回归关系,将输入变量 X1 到 X8 映射为输出 Y。

    线性回归的目标是最小化预测值与真实值之间的误差。损失函数通常采用最小二乘法,这可以确保模型参数通过梯度下降法找到最优解。

    相比于其他回归模型,线性回归模型的优势在于其简单易懂和计算效率。但它也存在局限性,例如只能处理线性关系的数据。

    图2展示了拟合效果的好坏,好模型应输出接近真实数据的预测值。图3则简要说明了回归模型的构建逻辑。

    2.2 K-邻近算法

    K-邻近算法(K-NN)是一种经典的无监督学习算法。其核心思想是,一个实例的标签由其周围最近的邻居标签的平均或多数决定。尽管其简单,但在某些场景下仍然具有很好的性能。

    3. 附录

    以下是机器学习中一些关键概念:

    • 交叉验证:多次使用不同的训练集数据验证模型泛化能力。
    • 特征缩放:通过标准化或归一化处理特征范围。
    • 降维:如PCA技术将高维数据映射到低维。
    • 缺失值处理:常用方法包括插值、均值填补和随机采样。

    如需进一步了解,建议参考相关文献资料。

    转载地址:http://czbtz.baihongyu.com/

    你可能感兴趣的文章
    ng 指令的自定义、使用
    查看>>
    nghttp3使用指南
    查看>>
    Nginx
    查看>>
    nginx + etcd 动态负载均衡实践(三)—— 基于nginx-upsync-module实现
    查看>>
    nginx + etcd 动态负载均衡实践(二)—— 组件安装
    查看>>
    nginx + etcd 动态负载均衡实践(四)—— 基于confd实现
    查看>>
    Nginx + Spring Boot 实现负载均衡
    查看>>
    Nginx + uWSGI + Flask + Vhost
    查看>>
    Nginx - Header详解
    查看>>
    Nginx - 反向代理、负载均衡、动静分离、底层原理(案例实战分析)
    查看>>
    nginx 1.24.0 安装nginx最新稳定版
    查看>>
    nginx 301 永久重定向
    查看>>
    nginx css,js合并插件,淘宝nginx合并js,css插件
    查看>>
    Nginx gateway集群和动态网关
    查看>>
    Nginx Location配置总结
    查看>>
    Nginx log文件写入失败?log文件权限设置问题
    查看>>
    Nginx Lua install
    查看>>
    nginx net::ERR_ABORTED 403 (Forbidden)
    查看>>
    Nginx SSL私有证书自签,且反代80端口
    查看>>
    Nginx upstream性能优化
    查看>>