html.parser |
您所在的位置:网站首页 › txt解析有什么用 › html.parser |
创建一个能解析无效标记的解析器实例。 如果 convert_charrefs 为 True (默认值),则所有字符引用( script/style 元素中的除外)都会自动转换为相应的 Unicode 字符。 一个 HTMLParser 类的实例用来接受 HTML 数据,并在标记开始、标记结束、文本、注释和其他元素标记出现的时候调用对应的方法。要实现具体的行为,请使用 HTMLParser 的子类并重写其方法。 这个解析器不检查结束标记是否与开始标记匹配,也不会因外层元素完毕而隐式关闭了的元素引发结束标记处理。 在 3.4 版本发生变更: convert_charrefs 关键字参数被添加。 在 3.5 版本发生变更: convert_charrefs 参数的默认值现在为 True。 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |