当前位置: 首页 > news >正文

【创新实训个人博客】数据库搭建

 1.原因

为了降低模型使用以前训练的数据或者幻觉知识,我们在对话时需要提供相关内容的数据,同时由于需要最新的广告实时数据,实时爬取和版权问题。数据由团队在网上爬取,为了广告内容的有效性,如果长期使用,数据库需要定期几个月更新一次。

2.数据库选择

我决定搭建本地轻量级数据库sqlite提供查询,数据采用最简单的方式,

3.数据表设计

一条数据包含的内容每个都不同

例如一条数据是

{"序号": 1, "公司名称": "四川腾晟乾建筑工程有限公司", "投放平台": " 巨量广告/千川 13859 (100.00%)", "投放广告创意数": "13,859", "投放天数": 14, "最后投放时间": "2025-04-14"}

而另一类数据则不同

{"序号": 89, "开发商名称": "海南捞月狗网络科技有限公司", "旗下主推产品": " 捞月狗 747 (99.20%), 偷星猫 6 (0.80%)", "投放广告创意数": "753", "投放天数": 14, "最后投放时间": "2025-04-14"}

我们不要求更加精细的查询,这对业务毫无意义。

因此按照默认生成的row_id作为主键,file_id是每个不同的类别,可以做查询和区分,第三列data是agent需要的数据

4.最终数据库截图

相关文章:

  • AOSP Android14 Launcher3——Launcher的状态介绍LauncherState类
  • 重合闸的作用与技术解析
  • Server-Side Request Forgery服务器端请求伪造(ssrf)
  • PDFMathTranslate:让数学公式在PDF翻译中不再痛苦
  • PDF嵌入图片
  • 新闻数据接口开发指南:从多源聚合到NLP摘要生成
  • Linux的例行性工作(crontab)
  • 自动驾驶(ADAS)领域常用数据集介绍
  • Windows 安装 Yarn 的教程
  • 4.2.2 MySQL索引原理以及SQL优化
  • LangChain构建大模型应用之RAG
  • java-mybatis01
  • 大模型时代的具身智能:从虚拟到现实的智能体进化革命
  • 用Python做有趣的AI项目 2:用 Python 和 NLTK 构建一个聊天机器人
  • 深度解析如何将图像帧和音频片段特征高效存储到向量数据库 Milvus
  • 深入浅出JVM - Java架构师面试实战
  • 有源晶振输出匹配电阻选择与作用详解
  • Spring security详细上手教学(三)密码管理
  • 如何把握邮件发送的黄金时间?
  • 北京工业大学25计专上岸经验分享
  • 商务部:将打造一批国际消费集聚区和入境消费友好商圈
  • 来论|如何看待韩企在美申请“饺子”专利
  • 央媒谈多地景区试水“免费开放”:盲目跟风会顾此失彼
  • 谁将主导“视觉大脑”?中国AI的下一个超级赛道
  • VR数字沉浸体验又添新节目,泰坦尼克号驶进文旅元宇宙
  • 青年如何打破“千人一面”,创造属于自己的文化观?