当前位置: 首页 > news >正文

AI写代码之GO+Python写个爬虫系统

下面我们我们来利用AI,来用GO+Python写个爬虫系统。

帮我写一个Python语言爬取数据写入Mysql的案例,信息如下:
1、Mysql数据库地址是:192.168.1.20 ,mysql用户名是:root, Mysql密码是:123456,要操作
的数据库是:ginxiaomi
2、要爬取的网址是http://bbs.itying.com/
3、需要把爬取的每一条新闻信息写入到artice表,article表有id,title,status字段
pip install requests beautifulsoup4 pymysql
import requests
from bs4 import BeautifulSoup
import pymysql
# 数据库连接配置
db_config = {
'host': '192.168.1.20',
'user': 'root',
'password': '123456',
'database': 'ginxiaomi',
'charset': 'utf8mb4',
'cursorclass': pymysql.cursors.DictCursor
}
# 连接到MySQL数据库
connection = pymysql.connect(**db_config)
try:
with connection.cursor() as cursor:
# 假设URL
url = 'http://bbs.itying.com/'
# 发送HTTP请求
response = requests.get(url)
response.raise_for_status() # 如果请求失败,抛出HTTPError异常
# 解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 假设每个新闻项都在一个class为'news-item'的div中
news_items = soup.find_all('div', class_='topic_title_wrapper')
for item in news_items:
# 假设每个新闻项有title和status(这里status可能需要根据实际页面结构进行调整)
title = item.find('a').get_text(strip=True) if item.find('a') else ''
status = '1' # 假设每个新闻都是激活状态,具体需要根据实际页面调整
# 插入数据到MySQL
sql = "INSERT INTO article (title, status) VALUES (%s, %s)"
cursor.execute(sql, (title, status))
# 提交事务
connection.commit()
print(cursor.rowcount, "record inserted.")
finally:
connection.close()
print("Done.")

不了解AI基础知识的同学可能看不懂,可以看看下面的视频了全面来了解,通过对AI的学习,我们会发现AI的能力远超我们的想象。(说明:前1-9讲是DeepSeek学习内容,需要全面学习AI编程的话可以从第10讲开始学)

【2025年新版】DeepSeek教程

前面我们也有详细分析Prompt提示词在多个领域的应用,从热点追踪、活动策划、文章撰写及实体抽取,到内容解释与优化、评论与说说创作,再到结合AI助手生成短视频;同时,Prompt提示词还可以快速辅助完成周报、简历、邮件及情书等文档撰写,并有效整理文档资料。针对运营编辑岗位,课程提供了文案支持、内容审核与舆情分析、数据分析及商业计划书撰写的Prompt技巧。此外,还深入讲解了利用Prompt生成PPT、思维导图,以及借助Mermaid.js生成图表、流程图、序列图、时间线图的方法。在编程领域,课程涵盖了AI编写前端、Flutter、嵌入式及Python、Go、Node.js等多种语言代码的Prompt应用,并扩展到Nodejs、Golang、Python结合MYSQL的Prompt爬虫系统开发。最后,课程还传授了AI编程Prompt技巧,包括接口文档生成、代码解释、代码与注释生成、语法检查、服务器命令解析、错误排查咨询,以及简历、报告、周报等文档撰写的Prompt高效方法,助力学员在任何场景中能游刃有余的使用Prompt Engineering。

相关文章:

  • Web3实战:从零开发你的ERC20代币合约
  • Idea 配置 Git
  • C++——多态、抽象类和接口
  • LLM 论文精读(一)Scaling Laws for Neural Language Models
  • 【Spring】静态代理、动态代理
  • 告别 Transformer:Mamba 模型如何实现线性时间序列建模
  • 如何在 Ansys Icepak AEDT 中设置多个流程以加快仿真速度?
  • AGI大模型(12):向量检索之关键字搜索
  • 乐视系列玩机------乐视2 x620红灯 黑砖刷写教程以及新版刷写工具的详细释义
  • GSAP 动画引擎实战:打造丝滑动效交互组件库
  • 百度 Al 智能体心响 App 上线
  • 探秘 SenseGlove Nova 2力反馈手套,解锁 VR 键盘交互新方式
  • 高并发秒杀使用RabbitMQ的优化思路
  • 1.3 本书结构概览:从理论基础到实践案例的系统阐述
  • Python3中使用jupyter notebook
  • 美乐迪电玩大厅加载机制与 RoomList 配置结构分析
  • 给vue-admin-template菜单栏 sidebar-item 添加消息提示
  • WHAT - 静态资源缓存穿透
  • 蓝耘平台介绍:算力赋能AI创新的智算云平台
  • 深入探讨JavaScript性能瓶颈与优化实战指南
  • 对话地铁读书人|企业公关吴丑丑:阅读中相遇又重逢
  • 教皇方济各逝世,外交部:表示哀悼,愿同梵方共同推动中梵关系持续改善
  • 我国与沙特签署《核能发展安全与安保合作谅解备忘录》
  • 重大虚开发票偷税骗补案被查处:价税2.26亿,涉700余名主播
  • 国安部:机关工作人员用软件扫描涉密文件备份网盘致重大泄密
  • 诺奖得主等数十位经济学家发表宣言反对美关税政策