たまにはプログラムの話題を。
CWebBrowser2 で読み込んだページからリンクをすべて抽出しようとしたので、ポイントを書いておこう。
・ get_document() で HTMLDocument → get_all() で HTMLElementCollection
・ HTMLElementCollection から item() で HTMLElement を取り出す
・ get_tagName() で tag が "a" or "A" のものを選択
・ QueryInterface() で HTMLAnchorElement を取り出して
・ get_href() で URL が取得できると。
HTMLDocument の get_anchors() ではうまくいかなかった。HTMLElementCollection が返ってくるわけではないのか?
後、HTMLElement の get_outerText() でリンクの文字列が得られる?(未テスト)
しかし、JavaScript とかで書けば数行のことなのに、結構大変だなぁ。