こんにちは、エンジニアのオオバです。
前回記事からの続きです。
あわせて読みたい記事
Pythonでログインサイト先のHTMLをパースする
最低限の機械学習の知識を手に入れるため勉強中。
本書の2章辺りのPythonを使ったブラウザ画面キャプチャをやってみます。
本書ではUbuntu環境をローカルに立てて実行していますが、本記事ではローカル環境(Mac)から実行しています。
Webブラウザを遠隔操作ツールSeleniumと、WebKitベースのコマンドラインから利用できるWebブラウザの`PhantomJSを使用します。
→11万文字で徹底解説した「DOTweenの教科書」Unityアニメーションの超効率化ツールはこちら
PhantomJSのインストール
npm install -g phantomjs
PhantomJSをインストールしようとして失敗した話はコチラ。
またはbrew install phantomjs
でもOK。
Seleniumのインストール
pipコマンドでseleniumをインストールします。
pip install selenium
実行
実行する前に、今回のソースはコチラ。
引数にキャプチャしたいサイトのURLと保存するファイル名を指定して実行します。
python webcapture.py https://google.com hoge
するとスクリーンキャプチャがhoge.png
としてローカルに保存されます。
この記事が気に入ったらフォローしよう
オススメ記事
検証環境
- macOS 10.12.6
- Selenium 3.7.0
- PhantomJS 2.1.1
- Python 3.6.3
- Node.js 9.0.0