程序聚合 软件案例 中石油数据处理平台-数据工厂

中石油数据处理平台-数据工厂

2025-10-22 20:11:14
行业:大数据、工业互联网
载体:网站、框架或代码包
技术:Java、JavaScript、Python

业务和功能介绍

多源异构数据集成与处理:数据工厂能够对接和整合来自采气厂、电力调度、分析化验、净化厂等多种业务系统的数据,包括地震数据、测录井曲线、分析化验曲线、地质模型网格化数据、视频监控等实时与非实时数据。通过采用GBaseMTK元数据同步工具、GBaseRTSync实时同步工具、Kafka消息队列、Sqoop、Flume等数据传输工具,平台实现了跨域数据汇集,解决了原有系统存在的“数据孤岛”问题。针对原有自研数据同步产品DSB存在的实时能力不足问题,平台通过解析数据库日志的方式,实现了对Oracle、MySQL、PostgreSQL等多种数据库的实时增量数据获取,显著提升了数据融合能力。
· 统一数据存储与分布式计算:平台采用分层存储架构,根据数据特性和应用场景选择最优存储方案。结构化数据使用GBase8s高并发事务数据库和GBase8a分布式分析数据库;半结构化和非结构化数据则依托基于Hadoop的GBaseHD平台,提供HDFS、Hive、HBase等存储与管理引擎;同时引入Neo4j图数据库处理关联关系复杂的业务数据。在计算层面,平台融合了批量处理、流计算和图计算多种模式,支持GBase8s/8a原生计算、MR/Spark/Flink等计算引擎,满足了油气田业务中OLAP、OLTP和NoSQL三种计算模型的多样化场景需求。
· 数据治理与质量管理:中石油制定了《公共数据编码管理规范》(Q/SY 10725-2023)等企业标准,提出了基于固定码的数据编码方法,建立了数据编码模型和规则,实现了物理实体对象与描述数据的精准关联。这一体系覆盖了数据全生命周期管理,包括数据需求、标准、编码、质量和应用评价等环节,通过数据血缘追踪、质量评估模型和数据溯源机制,确保了数据的准确性、一致性和可信度。在数据安全方面,平台采用国产数据库替代国外及开源产品,支持数据加密、备份恢复、一致性校验和操作审计,大幅提升了能源数据的安全防护能力。
· 数据服务与可视化分析:平台通过统一服务接口对外提供数据能力,包括结构化数据API、实时数据API、音视频API、GIS数据API、文档图片API等多样化服务方式。在梦想云平台中,数据服务层支持“一键式”秒级图件生成,将勘探研究项目的数据准备时间从原来的5小时缩短至1分钟以内。同时,平台提供大数据分析能力和可视化展示功能,支持数据检索、互动分析、关联分析等数据挖掘应用,为业务决策提供了直观的数据支撑。

项目实现

核心框架

· Spring Boot 2.7+ - 微服务快速开发框架
· Spring Cloud 2021+ - 微服务治理套件
· Spring Cloud Alibaba - 微服务增强组件

微服务组件

· Nacos - 服务注册发现与配置管理
· Spring Cloud Gateway - API网关路由
· OpenFeign - 服务间声明式HTTP调用
· Spring Cloud LoadBalancer - 客户端负载均衡

数据持久层

· MyBatis Plus - ORM框架及增强工具
· Spring Data JPA - 数据访问抽象层
· Druid - 数据库连接池

数据处理引擎

· Apache Spark - 大数据分布式计算
· Apache Flink - 流数据处理引擎
· Elasticsearch - 搜索引擎与数据分析

消息与缓存

· Apache Kafka - 消息队列与数据管道
· Redis - 缓存与会话存储
· RocketMQ - 分布式消息队列

安全框架

· Spring Security - 认证授权框架
· JWT - 无状态令牌认证

监控运维

· Spring Boot Admin - 应用监控管理
· SkyWalking - 分布式链路追踪
· Prometheus + Grafana - 指标监控可视化

JavaScript 前端技术栈

核心框架

· Vue 3.x - 渐进式JavaScript框架
· Vue Router - 单页面应用路由管理
· Pinia - 状态管理库

UI组件库

· Element Plus - 基于Vue 3的组件库
· ECharts - 数据可视化图表库
· Ant Design Vue - 企业级UI设计语言

开发工具链

· Vite - 前端构建工具
· TypeScript - JavaScript类型超集
· ES6+ - 现代JavaScript语法

网络通信

· Axios - HTTP请求库
· WebSocket - 实时数据通信

可视化技术

· D3.js - 数据驱动文档可视化
· Three.js - 3D数据可视化
· Mapbox GL JS - 地理空间数据可视化

示例图片视频


小鱼干
30天前活跃
方向: 后端-Java、前端-Web前端、
交付率:100.00%
相似推荐
宜昌慈善网络募捐平台采购项目
作为宜昌慈善总会官网 的移 动端延伸载体, 以 “ 引流赋 能 、 服务协同 ” 为核心理念,着力构建开放协同的移动慈善服务体系,全面拓展官网服务半径,推 动慈善事业数字化 转型。 一是扩大慈善项目社会影响力, 助力公众合规参 与慈善捐赠 ; 二是 以轻量化服务提升用户参 与体验,增强 官网 品牌感知度 与公众信任度 ; 三是 强化 官网服务 的精准性与公信力; 四是支撑官网运营优化与可持续发展。
宜昌市公办福利机构智能监管平台
当前,我市公办养老机构及其他公办福利机构,在“人、财、物”监管、食品安全及整体安全管理方面存在数据孤岛、监管手段滞后、风险预警不足等问题。面对“突击战”严峻形势,亟需通过定制化开发构建一个覆盖全市、统一高效的智慧监管平台,实现对公办福利机构(特别是农村福利院)的规范化、透明化、智能化监管。
WebServer
TinyWebServer 是一个用 C++14 从零构建的 Web 服务器,适用于学习 Linux 网络编程、I/O 多路复用、并发模型与 HTTP 协议实现。 ### 核心技术 | 技术点 | 实现 | |--------|------| | **I/O 多路复用** | epoll (ET/LT 可切换) | | **并发模型** | Reactor + 半同步/半反应堆 (HSHA) | | **线程池** | 固定大小线程池 + 条件变量 + shared_ptr 安全设计 | | **HTTP/1.1** | 手写状态机解析器 + Keep-Alive 长连接 | | **零拷贝** | mmap 内存映射文件传输 + writev 集中写 | | **定时器** | 小根堆 (二叉堆 + 哈希索引) O(log n) 超时管理 | | **数据库** | MySQL 连接池 + RAII 守卫 + SQL 注入防护 | | **日志** | 异步日志系统 (生产者-消费者 BlockDeque) + 日期/行数切分 | | **缓冲区** | 用户态 Buffer (readv 分散读 + 动态扩容 + 原子指针) |
spec-anchor — 基于AI自动标注的SPEC-Code追溯矩阵生成器
在AI辅助开发的SPEC-driven工作流中,开发者通过SPEC.md定义需求条目,并通过CLAUDE.md铁律约束AI在生成代码时自动带上@implements REQ-NNN注释标注。但传统追溯工具(IBM DOORS、Jama Connect等)太重型,需要手动标注,缺少一款轻量级的CLI工具来自动完成需求到代码的关联追溯。spec-anchor填補了这一空白,实现AI自动标注与自动追溯的闭环。 核心功能模块: • trace命令:解析SPEC.md提取需求条目(REQ-NNN格式),递归扫描源代码目录,通过两层匹配策略(Layer 1: @implements精确匹配;Layer 2: 关键词启发式兜底)关联需求与代码实现,生成Markdown/JSON格式的追溯矩阵 • impact命令:支持git提交范围或diff文件的反向影响分析,展示代码变更影响了哪些需求条目及其变更行数 • check命令:缺口检查,列出未实现和仅启发式匹配的需求,提供覆盖率统计 • 支持8种语言(Python/JS/TS/Go/Java/Rust/PHP/Ruby/Elixir)的函数名提取与注释识别,内置中英文关键词映射和同义词扩展 业务流程:开发者在SPEC.md中定义需求→AI生成代码时自动带@implements注释→运行spec-anchor trace生成追溯矩阵→运行spec-anchor impact查看变更影响→在PR中附上矩阵供reviewer审查
DWS数仓迁移工具MGC
内容: 项目简介:是一款支持ORACLE、TERADATA、GUASSA、GREENPLUM、NETEZZA、DB2、POSTGRESQL、NETEZZA等数据库的数据迁移到DWS数据库以及对应的脚本语法转换的工具,可以进行大规模、快速的数据仓库、主机、容器、大数据等迁移作业 软件架构:Sprinboot、SpringCloud、mybatis-plus、SSHD、Redis、Zmq、Nacos、Nginx 后端数据库:Gaussdb 我负责的功能模块:部分公共模块,主要负责数据仓库迁移服务 1、迁移工具的许可证License控制允许迁移数据量和SQL脚本转换数量 1、DWS数仓迁移工具的动态数据源框架和工具类 2、源端和目标端的数据连接 3、源端数据库的元数据获取 4、源端->目标端迁移工程创建 5、增量迁移、大表拆分条件控制 6、表结构、视图、索引转换 7、用户、角色、用户权限迁移 8、PG系列库元数据迁移 9、数据内容迁移 10、数据内容增量迁移 11、数据内容大表拆分迁移 12、数据内容迁移后的数据条目数量以及内容校验 13、校验完成后的迁移报告生成及下载 业绩: 国内外银行、通讯公司、政府组织、医疗组织以及各行业的数据仓库、容器、大数据迁移
帮助文档   Copyright @ 2021-2024 程聚宝 | 浙ICP备2021014372号
人工客服