差分
このページの2つのバージョン間の差分を表示します。
両方とも前のリビジョン 前のリビジョン 次のリビジョン | 前のリビジョン | ||
seleniumでwebスクレイピング覚書 [2022/03/23 12:37] – 133.11.144.12 | seleniumでwebスクレイピング覚書 [Unknown date] (現在) – 削除 - 外部編集 (Unknown date) 127.0.0.1 | ||
---|---|---|---|
行 1: | 行 1: | ||
- | ====== SeleniumでWebスクレイピング覚書 ====== | ||
- | |||
- | ===== クエリーパラメータを渡す際の注意点 ===== | ||
- | |||
- | BeautifulSoupでクエリーパラメータを含んだリクエストは送信できないので、クエリーパラメータを送信したいときはSeleniumを使用する。(クエリーパラメータを含んだURLを使用するだけでOK) | ||
- | |||
- | [[https:// | ||
- | |||
- | ===== seleniumの基本的な使い方 ===== | ||
- | |||
- | ライブラリーの読み込みとdriverの起動 | ||
- | ``` | ||
- | import time | ||
- | from selenium import webdriver | ||
- | import chromedriver_binary | ||
- | |||
- | driver = webdriver.Chrome() | ||
- | ``` | ||
- | |||
- | GETメソッドでリクエストを送信(クエリーパラメータはURLに入れれば良い) | ||
- | |||
- | リクエスト送信後にjavascriptの読み込みが完了するまでに時間を空けると良さそう??(time.sleep()ではなく、読み込み終わりみたいなメソッドがあればそれを使った方がよさげ) | ||
- | ``` | ||
- | driver.get(" | ||
- | time.sleep(5) | ||
- | ``` | ||
- | |||
- | |||
- | |||