RSS解析しようとしてて気がついた

読み込み

from xml.dom.minidom import parse
dom = parse(読み込みファイル名)

ノードのタイプ

タイプ
node.ELEMENT_NODE 要素(element)
node.ATTRIBUTE_NODE 属性(attribute)
node.TEXT_NODE テキスト
node.CDATA_SECTION_NODE CDATA
node.ENTITY_NODE 実体
node.PROCESSING_INSTRUCTION_NODE 処理命令(PI)
node.COMMENT_NODE コメント
node.DOCUMENT_NODE ドキュメント
node.DOCUMENT_TYPE_NODE ドキュメントタイプ
node.NOTATION_NODE NOTATION

値の取得

DOCUMENT_NODE
  • ノードタイプ

node.nodeType

  • テキストノード

node.data

  • ノード名の取得

node.nodeName

  • ノード値の取得

node.nodeValue

  • 指定したID属性の値を取得

node.getElementById(ID)

ELEMENT_NODE
  • 属性値の取得

element.getAttribute(属性名)

  • 属性の取得

element.getAttributeNode(属性名)

  • 属性の有無チェック

elenemt.hasAttributes

一通り書いて気がついた。

W3CのDOM仕様は一通りカバーしてるのか…