利用 Facebook的webDriver phantomjs驱动 做一个爬虫例子

利用 Facebook webDriver phantomjs驱动 可以不打开浏览器的情况下 进行页面渲染的web测试和爬虫
ps:应该更适合爬虫 为了做一个demo 决定爬一下66影视的电影资源

开启服务器 ./phantomjs –webdriver=127.0.0.1:8910
phantomjs说明
Facebook webDriver 是一种 Selenium 的php实现
相应的方法api可以参照 别的语言 的Selenium的实现 方法名字完全一样

基本的使用例子

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
require_once __DIR__ . "/vendor/autoload.php";

use \Facebook\WebDriver\Remote\WebDriverCapabilityType;
use \Facebook\WebDriver\Remote\RemoteWebDriver;
use \Facebook\WebDriver\WebDriverDimension;

$host = '127.0.0.1:8910';
$capabilities = array(
WebDriverCapabilityType::BROWSER_NAME => 'phantomjs',
'phantomjs.page.settings.userAgent' => 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:25.0) Gecko/20100101 Firefox/25.0',
);
$driver = RemoteWebDriver::create($host, $capabilities, 5000);

$window = new WebDriverDimension(1024, 768);
$driver->manage()->window()->setSize($window);

$driver->get('https://www.google.ru/');

$driver->takeScreenshot('/tmp/screen.png');
$driver->quit();