《神经网络与深度学习》第一章 绪论02 |
您所在的位置:网站首页 › 鸿沟什么 › 《神经网络与深度学习》第一章 绪论02 |
**字体变为红色的代码**
我是尺寸1.1 人工智能 智能=‘计算机控制’+‘智能行为’ 图灵测试提出的目的:为了对‘智能’做一个相对准确的定义 图灵测试的定义:一个人在不接触对方的情况下,通过一种特殊的方式和对方进行一系列的问答.如果在相当长的时间内,这个人无法判断对方是计算机还是人。那么就可以说这个计算机是具有智能的. 人工智能大致可以分为三个阶段:推理期、知识期以及学习期。 传统机器学习处理问题的一般流程? 传统机器学习主要是关注如何学习一个预测模型. 首先将数据表示成一组特征(Feature),特征的表示可以是连续的数值、离散的符号或者其他的形式. 然后将特征输入到预测模型当中,并获取相应的预测结果. 类似于以上流程的机器学习被称为传统机器学习.传统机器学习的显著特征 浅层学习,不涉及到特征的学习. 特征都是通过人工经验手工提取或者特征转换法来提取的.使用传统机器学习模型处理任务的一般流程 数据预处理(取出噪声等) 特征提取(从原始数据中提取一些有效的特征) 特征转换(主要包括对特征的升维和降维) 预测(学习出合适的f(x))注意点 每一步的特征处理以及最后的预测部分都是分开处理的. 主要影响模型质量的是前面的特征处理板块. 传统的机器学习就变为了特征工程. 1.3 表示学习(Representation learning) 什么叫做‘表示’? 为了提高模型的准确率或者提高效果,应该从原始的数据信息中提取或者将其转换为更加有效的特征或者表示. 表示就是更加一般化的‘特征’. 什么是语义鸿沟(Semantic gap)? 语义鸿沟是指:输入数据的底层特征和高层的语义信息之间的不一致性以及差异性. 解决语义鸿沟是表示学习的关键所在. 用例子说明语义鸿沟 比如给定很多车的图片(这些车的颜色形状都不尽相同) 想要借助模型去分类,那么更想其依赖更高层次的语义特征去完成任务,而不是仅仅依靠低层次的特征. 因为相较于底层特征来说,这些高层特征的差异更加明显,更加有利于处理任务. 在表示学习中两个较为核心的问题是什么? 什么是一个好的表示? 如何学习到一个好的表示? 好的表示具有的优点(特征) 具有很强的表示能力:同样大小的向量往往可以表示更多的信息. 更加利于后续任务:需要包含更高层次的语义信息,可以使得任务处理更为方便. 泛化能力更强:可以很容易的迁移到其余领域或者其他任务数据上. 特征表示的两种方式 局部表示:一般可以表示为one-hot表示. 分布式表示 局部表示的优缺点 优点 简单,可解释性较强. 处理过程中都是稀疏的二值向量,运算效率较高. 缺点 扩展性较差.因为如果此时要新加一个东西,那么必须对one-hot编码的维度进行扩维. 不同事物的编码表示的相似度均为0.比如,要对红色和中国红两种颜色进行one-hot编码,显然无法从最后的编码结果看出两者是近似的. 分布式表示(或者分散式表示) 定义:将事物的语义分散到语义空间中的不同基向量上. 分布式表示的向量的维度一般都较低. 局部表示与分布式表示的对比
|
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |