結構化標記處理工具?
Python 支持各種模塊,以處理各種形式的結構化數據標記。 這包括使用標準通用標記語(yǔ)言(SGML)和超文本標記語(yǔ)言(HTML)的模塊,以及使用可擴展標記語(yǔ)言(XML)的幾個(gè)接口。
html
--- 超文本標記語(yǔ)言支持html.parser
--- 簡(jiǎn)單的 HTML 和 XHTML 解析器html.entities
--- HTML 一般實(shí)體的定義- XML處理模塊
xml.etree.ElementTree
--- ElementTree XML APIxml.dom
--- 文檔對象模型 APIxml.dom.minidom
--- 最小化的 DOM 實(shí)現xml.dom.pulldom
--- 支持構建部分 DOM 樹(shù)xml.sax
--- 支持 SAX2 解析器xml.sax.handler
--- SAX 處理句柄的基類(lèi)xml.sax.saxutils
--- SAX 工具集xml.sax.xmlreader
--- 用于 XML 解析器的接口xml.parsers.expat
--- 使用 Expat 的快速 XML 解析