無駄な事をする人 その1
最近 サイトからデータ取得の依頼がいくつかあり こちらの手がまわらないので
知り合いのPGに手伝ってもらったのだが...
やり方としてはVBSでIEを操作しサイトを読み込ませ、そこから
データを抽出するという方法を使っています。
1.DOMを使わないで内容を解析しようとする
GetElementsByTagName
を使うと各タグのリストが得られるという事だけを
知っていて あとは各タグから
InnerHTML
で得られる文字列で処理してしまう。
↓
HTML全体の構造(親子関係)タグの内容(エレメント部分)すべて
IEに読み込まれた時点でparseされてデータが取得しやすい状態に
なっていて
アトリビュート部分も下記のような場合
<img class="imgaddr"src="xxx@aaa.jp"/>
↓
tag.GetElementsByTagName("IMG").item(0).attributes.getNamedItem("src").value
で一発で取得できるんです。