IE コンポーネントでページからリンクを抽出

たまにはプログラムの話題を。

CWebBrowser2 で読み込んだページからリンクをすべて抽出しようとしたので、ポイントを書いておこう。
・ get_document() で HTMLDocument → get_all() で HTMLElementCollection
・ HTMLElementCollection から item() で HTMLElement を取り出す
・ get_tagName() で tag が "a" or "A" のものを選択
・ QueryInterface() で HTMLAnchorElement を取り出して
・ get_href() で URL が取得できると。

HTMLDocument の get_anchors() ではうまくいかなかった。HTMLElementCollection が返ってくるわけではないのか？

後、HTMLElement の get_outerText() でリンクの文字列が得られる？（未テスト）

しかし、JavaScript とかで書けば数行のことなのに、結構大変だなぁ。

パソコン・メモメモ備忘録

気の向くままパソコン関係等で気になることを書き記す。時々更新！

IE コンポーネントでページからリンクを抽出