Wedata-腾讯云
数据集成
操作轻量化、过程可视化、能力开放化数据集成能力,支持复杂网络环境下、丰富的异构数据源之间高速稳定的海量数据同步。
全场景同步:包括实时同步与离线同步。
多类型异构数据源:支持30+数据源提供星型结构支持读写随机搭配。
T转换
数据级:对同步中的数据进行内容转换,如数据过滤、Join 等。
字段级:提供单个字段转换处理,包括自定义数据字段、格式转换、时间格式转换等。
任务及数据监控
读写指标:支持任务读写实时指标统计,包括读写总量、速度、吞吐、以及脏数据等。
监控告警:支持任务及资源监控,覆盖短信、邮件、HTTP 等多渠道告警。
数据开发
通过严谨的 CI/CD 流程规范和自动化的测试发布运维加持能力,缩短从原始数据加工运维到业务应用数据的路径,提升效率的同时保障数据质量。
在线代码开发:支持代码开发,对任务工作流进行易用拖拽式编排,同时支持大规模任务的可视化编排呈现。
代码开发:支持对 HiveSQL、SparkSQL、JDBCSQL、Spark、Shell、MapReduce、PySpark、Python、TBase、DLC SQL、DLCSpark、TCHouse-P、Impala 等任务进行在线代码开发、调试,以及版本管理。
任务测试:支持任务和工作流测试及版本管理。
开发辅助:提供项目、工作流和任务三种粒度的参数配置,支持时间参数运算以及函数参数。
版本管理:支持事件、函数、任务和参数的版本管理。
代码管理:提供代码统一的管理、导入和导出。
编排调度:对任务进行流程编排及提交调度。
调度方式:支持周期、一次性和事件触发调度,周期调度提供 crontab 方式配置。
依赖策略:支持任务自依赖和工作流自依赖。
跨周期依赖配置:提供跨周期依赖配置及自定义依赖配置,上下游依赖实例范围支持按需自定义选择。
批量编排:提供 Excel 批量创建任务及依赖的能力,加快任务依赖编排效率。
发布运维:对开发完成的任务按需发布到生产环境,并对任务进行统一监控和运维。
任务发布:支持将开发成果发布上线。
监控运维:对任务进行流程编排及提交调度。
分析探索:智能易用的数据开发方式提升任务协同开发效率,帮助用户清晰查看任务处理过程,有效提升数据即席探索效能。
在线编辑:提供可视化的交互式分析 IDE。
运行:提供执行信息可视化。
开发辅助:提供开发辅助效率工具。
数据治理(with Unity Semantics)
元数据中心
元数据采集:WeData 提供给用户自定义元数据采集任务功能,管理员对数据源进行元数据采集后才能进行可视化管理,采集粒度支持到库,每个数据库仅可创建一个采集任务,采集任务将根据配置周期按计划运行和更新元数据信息,同时支持手动运行、任务编辑等管理操作。
实例运维:管理采集任务执行后的实例,包括查看任务名称、创建人、采集计划、执行状态、开始时间、
云计算