当前位置: 首页 > news >正文

用selenium+ChromeDriver豆瓣电影 肖申克的救赎 短评爬取(pycharm 爬虫)

一、豆瓣电影 肖申克的救赎 短评url=https://movie.douban.com/subject/1292052/comments

 

 

二、基本知识点讲解

1. Selenium 的基本使用

Selenium 是一个用于自动化浏览器操作的库,常用于网页测试和爬虫。代码中使用了以下 Selenium 的核心功能:

  • webdriver.Chrome: 启动 Chrome 浏览器实例。

  • driver.get(url): 打开指定的网页。

  • driver.find_elements: 查找页面中符合条件的所有元素。

  • driver.execute_script: 执行 JavaScript 代码(例如点击按钮)。

  • driver.quit(): 关闭浏览器并结束 WebDriver 会话。


2. ChromeDriver 的配置

  • Service: 用于指定 ChromeDriver 的路径。

  • executable_path: ChromeDriver 可执行文件的路径(需与 Chrome 浏览器版本匹配)。


3. 页面元素的定位

Selenium 提供了多种定位页面元素的方式,代码中使用了以下方法:

  • By.XPATH: 使用 XPath 表达式定位元素。

相关文章:

  • 基于CNN-LSTM联合网络的主瓣干扰辨识
  • 三个HTTP请求参数注解@RequestHeader、@RequestParam和@RequestBody的使用对比
  • 神聖的綫性代數速成例題21. 酉空間的基本概念、酉變換與酉矩陣的性質及應用、矩陣的奇異值分解及其應用
  • Eclipse Debug 调试
  • 【C++】STL库_list 的模拟实现
  • 三个print优雅打印datetime模块的“时间密码”
  • 笔试专题(二)
  • Rust函数、条件语句、循环
  • 动态查找表
  • 1.2 编译器结构
  • 把 ASP.NET Core 服务(BigDogServer)部署到 Linux 并作为服务运行
  • 一文读懂 GPT 与 BERT:预训练逻辑及差异剖析
  • 缓存过期时间之逻辑过期
  • 蓝桥备赛(25)算法篇【差分】
  • word文件转换为Markdown格式
  • 关于极端场景下,数据库更新与 MQ 消息一致性保障方案的详细总结
  • Qt信号与槽高级特性与项目实战:原理剖析与工程化应用指南
  • 20250330 Pyflink with Paimon
  • rocky linux下载软件
  • [Python]代理批量检测延迟工具
  • 美国“杜鲁门”号航母一战机坠海
  • 诗词文赋俱当歌,听一听古诗词中的音乐性
  • 国务院任免国家工作人员:饶权任国家文物局局长
  • 第1现场|无军用物资!伊朗港口爆炸已遇难40人伤1200人
  • 幸福航空取消“五一”前航班,财务人员透露“没钱飞了”
  • 榆林市委常委王华胜已任榆林市政协党组书记