Skip to content →

PHPな話。

どもども。@mでっす。
私はですね、昔から、googleの検索結果を解析してやりたいと思っておりました。
ですが、そーすを見たりしてもJavascriptだらけで、
どこが検索結果なのかさえ分かりません。
どうしようかな。こういうJavascript交じりのhtmlから
JavaScriptを取り払って、解析できるようにするにはどーすればいいのかな。。。
「HTML 静的化」カタカタ

 URLじゃねぇ!
そういうことじゃない!
「html Javascript 静的化」カタカタ
・・・
「Javascript html 出力」カタカタ
・・・

でねえ!!

あーあ。
かなしいなぁ。

ということで数か月が過ぎました

webをうろうろしていた時…
PHPJPという素晴らしいページを見つけました。
そこの記事をあさっていた時。。。
これをみつけたのです。DOM Parserだと。
なるほどだからかからなかったわけだ。そもそも言葉が間違っていた。
○「DOM Parse」  ×「JavaScript 静的化」
そこで、このページを参考に解析プログラムを組んでみた。
PHPJPさん、ありがとうございます!
ここに置きました。このphpと同じフォルダに、ここからDLできるsimple_html_dom.phpをいれれば、
kekkaiseki.php?q=<キーワード>で結果が解析されます。
また、htmlの構造を配列に入れる部分にはこのページを参考にさせていただきました。
ありがとうございます!
こんどはGoogle画像検索をやってみます。
そのうちYamaXの画像認識機能に使うつもりです。

Published in HTML PHP YamaX 解析