当前位置：首页 > news >正文

时序数据库 TDengine 助力石油石化业务，平滑接替 Oracle 数据库

news 来源：原创 2025/4/24 8:23:25

小T导读：胜软科技在石油石化行业中选择使用 TDengine 处理时序数据，不仅显著降低了运维数据库的成本，也大幅减少了存储空间的占用，实现了从原有的 40 多套 Oracle 数据库向仅 9 套 TDengine集群的精简替换。在迁移过程中，原有表结构几乎无需调整即可平滑移植至 TDengine。早在 TDengine 2.x 版本阶段，胜软科技便已开始部署使用，并在 TDengine 3.0 发布后完成升级，受益于 3.x 版本在功能和性能方面的诸多优化，尤其是数据订阅、企业版工具 taosX 等新功能，为实际应用带来了显著便利。本文将分享其在迁移与落地过程中的实践经验。

1. 背景概述

石油石化行业的时序数据广泛应用于能源生产、运输、加工和销售等环节，大量设备、传感器和监控系统持续生成时时序数据，用于支撑生产监控、调度优化和故障预警。早年时序数据库尚不成熟，我们曾采用 Oracle 存储某大型油田的时序数据，但随着业务数据量快速增长，各油田系统在数据处理和查询性能上逐渐暴露出瓶颈。

1.1 没有万能的数据库，只有合适的数据库

Oracle 作为传统关系型数据库的佼佼者，其稳定性和性能毋庸置疑。但用于存储海量时序数据并不合适，效率低、成本高的问题日益突出。要从根本上解决瓶颈，唯一的办法就是替换 Oracle。近年来，时序数据库快速发展，引起了我们的关注，针对时序数据的特性，选用专业的时序数据库已成为必然选择。

1.2 降低管理维护成本，简化运维

随着业务系统不断扩展，Oracle 数据库数量已增长至数十套，管理和维护成本居高不下，存储成本也持续攀升。而时序数据库在处理海量时序数据方面具备天然优势，超高压缩比大幅降低了存储开销。其分布式架构不仅支持灵活扩展计算资源以应对新增业务，还可便捷扩容节点存储空间，满足持续增长的数据需求。

1.3 软件国产化趋势下的重新选择

在石油石化行业，推进数据库软件国产化替代已成为信息化建设的重要趋势，旨在提升数据安全性、减少对国外厂商的依赖，并响应国家信创政策的要求。同时，数据库选型还需综合考虑其社区活跃度、发展前景，以及替换 Oracle 所需的改造成本等关键因素。

选型过程中，我们发现 TDengine 正是国产时序数据库中的重要一员：

将核心代码进行完全开源 https://github.com/taosdata/TDengine
支持集群、多副本等重要功能，集群环境下有更高的高可用性
TDengine 也已经支持众多的国产操作系统、CPU 平台
“一个设备一张表”与“超级表”的概念，设计了创新的存储引擎，让数据的写入、查询和存储效率都得到极大的提升，与我们当前业务匹配度很高
社区活跃度高，版本发布时间相对稳定，新功能在不断丰富
支持 SQL 语法，应用代码改动量小

经过前期充分的测试与验证，我们最终决定选用时序数据库 TDengine 来存储时序数据。

2. Oracle 切换至 TDengine

在我们的实时数据业务中，涉及实时类的设备和井等超过 70 种类型。过去在 Oracle 中，每类设备对应一张大表，所有同类设备的数据集中存储，字段类型多为 NUMBER、DATE、VARCHAR2 等。迁移至 TDengine 后，我们将字段类型调整为 TIMESTAMP、INT、DOUBLE、FLOAT、VARCHAR、NCHAR，并为每类设备建立一个超级表。

TDengine 要求超级表必须设置 tag 列，我们将设备编码作为首个 tag，用于标识每个具体设备或井。每个超级表下可创建多个子表，结构与超级表一致。这种设计方式与我们的业务场景高度契合，在后续的数据写入和查询性能上也带来了显著提升。

总体来看，从 Oracle 切换到 TDengine 比较顺利。

Oracle 库中的某表

TDengine 中的对应表

3. TDengine 大版本升级

早在 2022 年，我们就开始使用 TDengine 2.4 和 2.6 企业版。2023 年，在涛思数据企业版团队的支持下，我们顺利完成了向 3.0 的升级。由于 2.x 无法直接本地升级至 3.x，我们采用搭建临时集群的方式，制定了完整的升级与历史数据迁移方案，有效规避了业务中断风险。升级过程中，借助 taosX 工具，我们在不影响系统运行的前提下完成了历史数据迁移。以某单位为例，单副本 6T 数据在一周内全部迁移完成，最终成功切换至 3.0 版本。

TDengine 3.0 在使用方式上与 2.x 保持高度一致，写入、查询等核心功能无需大幅改动，仅需将 taos-jdbcdriver 升级至对应版本即可。

我们选择升级的另一个重要原因，是 3.0 提供了更强大、灵活的数据订阅能力。相比 2.x 中相对简单的订阅功能，3.0 支持按 SELECT、超级表、数据库等多级别进行订阅，既可将实时数据分发至其他系统，也能高效实现集群间数据同步，显著提升了业务集成与扩展能力。

4. 落地效果

TDengine 上线后，系统运行始终保持稳定，在性能、存储效率和运维管理等方面都取得了显著成效。在使用与集成过程中，涛思数据的售后团队通过多种沟通渠道及时响应，持续提供专业支持，为项目的顺利推进提供了有力保障。

4.1 性能提升

应用 TDengine 后写入、查询方面都有很大提升，以下是早期的部分模拟测试场景：

测试内容	概要总结
数据写入	50000 井、2,000,000,000 条数据的写入用时：2355.37 s 写入平均速度：849121.05 条/秒，140,954，094.3 点/秒平均写入频率：208.25ms 最大写入间隔：3000.03ms 最小写入间隔：11.64ms
单设备表 1 天数据查询	50000 设备、2,000,000,000 条数据选择 1 个设备表，该设备 3 天数据中查询 1 天数据，输出到 CSV 文件平均查询时间：2.64s
全量表中 TAG 过滤单表查询	50000 设备、2,000,000,000 条数据中，在超级表中，有 5w 子表，使用 tag 过滤，在该子表增加 1 天时间限制，进行查询平均用时：0.29s
单设备表 1 条聚合查询	50000 设备、2,000,000,000 条数据中，在超级表中，有 5w 子表，使用 tag 过滤，进行 1 天时间段的聚合查询（ count（*），max（wd）， min（yy），avg（gl_sz））的查询平均用时：1.41ms
全量表按标签聚合	50000 设备、2,000,000,000 条数据中，在超级表中，有 5w 子表，查询所有测点在某个时间段内测点采集值的 count，max，min，avg 和 tag 分组查询按照 tag 分组平均用时：2.29s
全量表中按标签和时间段聚合	50000 设备、2,000,000,000 条数据中，在超级表中，有 5w 子表，按照 1 小时、1 天的时间窗口进行分组后的 count，max，min，avg 聚合结果。 1 小时聚合：9.76ms 1 天聚合：8.72ms
全量数据时间最新数据查询	50000 设备、2,000,000,000 条数据中全量数据中，查询该测点在所有数据中时间戳最大的一条记录。平均用时：0.311s

业务应用查询实时数据展示：

4.2 压缩比高，存储、运维成本降低

TDengine 具备出色的压缩能力，我们原先几张大表在迁移后，存储空间大幅减少，压缩率（见下图中的 Compression_Ratio）已降至个位数。

过去使用 40 多套 Oracle 数据库，如今各单位仅需部署 1 套 TDengine 集群即可满足业务需求，显著降低了运维成本。TDengine 支持多级存储，有效提升写入性能；我们目前采用 0 级挂载多个目录的方式，也提升了 I/O 吞吐能力。后续无论是为单台服务器扩容磁盘，还是增加节点扩展集群，操作都相对便捷。

4.3 数据订阅的使用

TDengine 提供了类似消息队列的数据订阅与消费接口，用户可在系统中定义 topic，与 Kafka 的使用方式相似。在许多场景下，借助 TDengine 构建时序大数据平台，我们无需再额外集成消息队列产品，极大简化了系统架构，也降低了运维成本。

在数据质量监测应用中，我们利用 TDengine 的订阅功能判断数据点的上报值是否处于合理范围，实现了实时的数据校验与告警。

我们不仅在业务系统中使用了数据订阅功能，在多个集群之间进行实时数据同步时，也同样依赖这一机制。通过 taosX 提供的 TMQ 数据订阅接口方式，我们实现了将数据实时同步至另一套集群，实现读写分离，进一步提升了生产环境的稳定性。

此外，数据订阅还有一个重要用途：辅助校验数据写入的准确性。通过订阅可以发现是否存在重复或乱序数据。由于 TDengine 默认以第一列为主键，同一子表中相同时间的数据仅保留一条，后写入的数据会覆盖先前的。借助这一机制，我们排查并解决了数据重复与乱序写入的问题，优化调整后，系统在读写性能与存储效率方面都实现了进一步提升。

5. 使用 TDengine 的心得

时序数据库与关系型数据库在数据存储量上存在显著差异，通常前者需要处理更大规模的数据。在查询时，需特别注意 SQL 的编写方式，重点聚焦时间范围内的数据，而非全表扫描，以避免不必要的资源消耗。

建议如下：

查询超级表时，务必添加第一列的时间戳范围过滤，精准限定查询时间段；
优先使用 tag 列进行过滤，而非普通列，可显著提升查询效率；
充分利用数据库的缓存机制，数据可直接从内存中获取，查询速度更快，比如获取每个设备的最新一条记录等场景。

6. 结语

石油石化是胜软科技重点服务的行业之一，而涛思数据也在该领域积累了丰富的实践经验。未来，我们将继续与涛思数据深入合作，持续探索更多业务场景的应用可能，充分发挥时序数据库在大规模时序数据管理方面的优势，并进一步推动与其他系统组件的集成，共同打造更高效、智能的数据平台。

关于胜软科技：

山东胜软科技股份有限公司成立于 2002 年，是国家高新技术企业，新三板挂牌企业，依托国家级双跨工业互联网平台“胜软云帆”构建一体化软件生产生态体系，打造以业务、技术为双擎的核心驱动力。面向智慧能源、智慧城市、智能制造三航道，提供战略规划、方案设计、软件开发实施、系统集成运维服务，目前已发展成为国内油气领域规模最大的民营软件服务商。采用北京+东营“双总部”运营模式，设有济南研发中心，在北京、成都、郑州、乌鲁木齐、青岛设有分公司，此外拥有 9 家子公司，1 家海外公司，客户遍布全国 24 个省市自治区和海外 8 个国家与地区。

作者：研发经理王强、孙东超