RSS解析しようとしてて気がついた
読み込み
from xml.dom.minidom import parse
dom = parse(読み込みファイル名)
ノードのタイプ
値 | タイプ |
---|---|
node.ELEMENT_NODE | 要素(element) |
node.ATTRIBUTE_NODE | 属性(attribute) |
node.TEXT_NODE | テキスト |
node.CDATA_SECTION_NODE | CDATA |
node.ENTITY_NODE | 実体 |
node.PROCESSING_INSTRUCTION_NODE | 処理命令(PI) |
node.COMMENT_NODE | コメント |
node.DOCUMENT_NODE | ドキュメント |
node.DOCUMENT_TYPE_NODE | ドキュメントタイプ |
node.NOTATION_NODE | NOTATION |
値の取得
DOCUMENT_NODE
- ノードタイプ
node.nodeType
- テキストノード
node.data
- ノード名の取得
node.nodeName
- ノード値の取得
node.nodeValue
- 指定したID属性の値を取得
node.getElementById(ID)
ELEMENT_NODE
- 属性値の取得
element.getAttribute(属性名)
- 属性の取得
element.getAttributeNode(属性名)
- 属性の有無チェック
elenemt.hasAttributes
一通り書いて気がついた。
W3CのDOM仕様は一通りカバーしてるのか…