西瓜书(周志华):什么是版本空间以及如何求取版本空间 |
您所在的位置:网站首页 › 小红书求图是什么意思 › 西瓜书(周志华):什么是版本空间以及如何求取版本空间 |
下面是自己结合百度的资料来理解的一些比较通俗的说法: 假设空间:属性所有可能取值组成的可能的样本 版本空间:与已知数据集一致的所有假设的子集集合。
(绿色加号代表正类样本,红色小圈代表负类样本) GB 是最大泛化正假设边界(maximally General positive hypothesis Boundary),; SB 是最大精确正假设边界(maximally Specific positive hypothesis Boundary) GB与SB之间所围成的区域就是版本空间。
----->总结: 在西瓜问题中,如何根据训练集求所对应的版本空间? ①写出假设空间:先列出所有可能的样本点(即特征向量)(即每个属性都取到所有的属性值) ②对应着给出的已知数据集,将与正样本不一致的、与负样本一致的假设删除。 即可得出与训练集一致的假设集合,也就是版本空间了。
----->举例:
表1.1的训练数据集对应的假设空间应该如下: 1 色泽=*,根蒂=*,敲声=* 2 色泽=青绿,根蒂=*,敲声=* 3 色泽=乌黑,根蒂=*,敲声=* 4 色泽=*,根蒂=蜷缩,敲声=* 5 色泽=*,根蒂=硬挺,敲声=* 6 色泽=*,根蒂=稍蜷,敲声=* 7 色泽=*,根蒂=*,敲声=浊响 8 色泽=*,根蒂=*,敲声=清脆 9 色泽=*,根蒂=*,敲声=沉闷 10 色泽=青绿,根蒂=蜷缩,敲声=* 11 色泽=青绿,根蒂=硬挺,敲声=* 12 色泽=青绿,根蒂=稍蜷,敲声=* 13 色泽=乌黑,根蒂=蜷缩,敲声=* 14 色泽=乌黑,根蒂=硬挺,敲声=* 15 色泽=乌黑,根蒂=稍蜷,敲声=* 16 色泽=青绿,根蒂=*,敲声=浊响 17 色泽=青绿,根蒂=*,敲声=清脆 18 色泽=青绿,根蒂=*,敲声=沉闷 19 色泽=乌黑,根蒂=*,敲声=浊响 20 色泽=乌黑,根蒂=*,敲声=清脆 21 色泽=乌黑,根蒂=*,敲声=沉闷 22 色泽=*,根蒂=蜷缩,敲声=浊响 23 色泽=*,根蒂=蜷缩,敲声=清脆 24 色泽=*,根蒂=蜷缩,敲声=沉闷 25 色泽=*,根蒂=硬挺,敲声=浊响 26 色泽=*,根蒂=硬挺,敲声=清脆 27 色泽=*,根蒂=硬挺,敲声=沉闷 28 色泽=*,根蒂=稍蜷,敲声=浊响 29 色泽=*,根蒂=稍蜷,敲声=清脆 30 色泽=*,根蒂=稍蜷,敲声=沉闷 31 色泽=青绿,根蒂=蜷缩,敲声=浊响 32 色泽=青绿,根蒂=蜷缩,敲声=清脆 33 色泽=青绿,根蒂=蜷缩,敲声=沉闷 34 色泽=青绿,根蒂=硬挺,敲声=浊响 35 色泽=青绿,根蒂=硬挺,敲声=清脆 36 色泽=青绿,根蒂=硬挺,敲声=沉闷 37 色泽=青绿,根蒂=稍蜷,敲声=浊响 38 色泽=青绿,根蒂=稍蜷,敲声=清脆 39 色泽=青绿,根蒂=稍蜷,敲声=沉闷 40 色泽=乌黑,根蒂=蜷缩,敲声=浊响 41 色泽=乌黑,根蒂=蜷缩,敲声=清脆 42 色泽=乌黑,根蒂=蜷缩,敲声=沉闷 43 色泽=乌黑,根蒂=硬挺,敲声=浊响 44 色泽=乌黑,根蒂=硬挺,敲声=清脆 45 色泽=乌黑,根蒂=硬挺,敲声=沉闷 46 色泽=乌黑,根蒂=稍蜷,敲声=浊响 47 色泽=乌黑,根蒂=稍蜷,敲声=清脆 48 色泽=乌黑,根蒂=稍蜷,敲声=沉闷 49 Ø
根据总结,按照上述过程进行学习: (1,(色泽=青绿、根蒂=蜷缩、敲声=浊响),好瓜) 可以删除假设空间中的3、5、6、8、9、11-15、17-21、23-30、32-49 (2,(色泽=乌黑、根蒂=蜷缩、敲声=浊响),好瓜) 可以删除剩余假设空间中的2、10、16、31 (3,(色泽=青绿、根蒂=硬挺、敲声=清脆),坏瓜) 可以删除剩余假设空间中的1 (4,(色泽=乌黑、根蒂=稍蜷、敲声=沉闷),坏瓜) 剩余假设空间中无可删除的假设
学习过后剩余的假设为: 4 色泽=*,根蒂=蜷缩,敲声=* 7 色泽=*,根蒂=*,敲声=浊响 22 色泽=*,根蒂=蜷缩,敲声=浊响 这就是最后的“假设集合”,也就是“版本空间”。
|
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |