簡単PythonとPhantomJSとSeleniumを使ったWebサイト画面キャプチャ

こんにちは、エンジニアのオオバです。

前回記事からの続きです。

あわせて読みたい記事

Pythonでログインサイト先のHTMLをパースする

最低限の機械学習の知識を手に入れるため勉強中。

本書の2章辺りのPythonを使ったブラウザ画面キャプチャをやってみます。
本書ではUbuntu環境をローカルに立てて実行していますが、本記事ではローカル環境(Mac)から実行しています。

Webブラウザを遠隔操作ツールSeleniumと、WebKitベースのコマンドラインから利用できるWebブラウザの`PhantomJSを使用します。

PhantomJSのインストール

npm install -g phantomjs

PhantomJSをインストールしようとして失敗した話はコチラ。
またはbrew install phantomjsでもOK。

pipコマンドでseleniumをインストールします。

pip install selenium

実行する前に、今回のソースはコチラ。

引数にキャプチャしたいサイトのURLと保存するファイル名を指定して実行します。

python webcapture.py https://google.com hoge

するとスクリーンキャプチャがhoge.pngとしてローカルに保存されます。

この記事が気に入ったらフォローしよう

DirectX11をC#を書きながら覚えていく

C#でDirectX 軽い気持ちでSlimDXを使うとき用ライブラリSlimDXSketchを作りました

検証環境