美文网首页
数据成本管理

数据成本管理

作者: 傻疯子 | 来源:发表于2021-12-29 20:52 被阅读0次

数据成本问题主要可以分为两大类问题:数据加工的资源浪费,数据存储的资源浪费。

数据加工的资源浪费的问题主要包括一些数据加工任务使用价值低或者未使用、一些表重复加工、数据倾斜和配置不合理导致空占大量资源,这些问题都会浪费大量计算资源。另外资源调度周期的不合理会导致许多时间段大量的计算资源是闲置的。

数据存储的资源浪费的问题主要包括过期数据未定时处理、数据未压缩、重复创建表,这些问题导致存储资源被浪费。

数据成本管理流程:

1.首先通过数据血缘建立资产全局视图,并进行成本和价值计算。
计算末端数据的成本主要是上游所有依赖的任务和所有存储的表。被多个下游所应用则需要分摊成本。
计算数据价值主要分为三类:用于出报表则根据使用人群和使用次数去衡量。数据应用则考虑数据应用价值。做数据探索的则依据分析师人员和使用情况去衡量。

2.归类问题
包括未使用的数据、价值低的数据、高峰期高消耗的数据。

3.成本治理
对于未使用的数据这类造成资源浪费的末端任务,进行下线,一直到所有末端任务都符合要求。
对于价值低的数据需要确定是否有必要继续使用,如果没必要也进行相应下线。
针对资源消耗高的任务做改进:处理数据倾斜的任务,优化任务的配置参数,迁移非重要的任务到低峰期,
针对存储消耗高的数据做改进:压缩上小文件不做split可以用gzip,大文件支持split可以用lzo。对于一些汇总表和维度表做定期清理。

4.评估治理效果
通过查看下线的任务和数据而节省了多少高峰期使用资源和存储空间,从而得出节省出来的费用。

然后可以通过建设数据成本系统,查看资源的使用和存储空间情况,数据相关使用、成本和数据应用情况,并提供数据下线管理。

相关文章

  • 数据成本管理

    数据成本问题主要可以分为两大类问题:数据加工的资源浪费,数据存储的资源浪费。 数据加工的资源浪费的问题主要包括一些...

  • 成本核算软件(Time-cost)的人力成本核算方式和详细的算法

    项目成本管理系统的核心功能,一般包含项目立项、项目预算数据导入、计划成本管理、WBS分解管理、进度计划管理、合同管...

  • 浅谈企业的数据资产管理

    一、为何需要进行数据资产管理 成本控制 大数据离不开计算和存储,因此大数据建设与成本强挂钩。大数据需要耗费大量的计...

  • 为什么仓库需要应用到手持终端?

    传统仓库管理,仍然采用人工纸张记录、输入的方式来进行数据采集与管理,这样的管理模式人工成本高、数据易丢失、数据更新...

  • 数据成本

    待补充计算成本相关内容 存储成本1、结合数据资产等级和数据仓分层,对数据生命周期进行管理(数据清理)2、利用谁生产...

  • 阿里巴巴大数据实践(数据管理篇)

    第12章 元数据第13章 计算管理第14章 存储和成本管理第15章 数据质量第16章 数据应用 第12章 元数据 ...

  • 如何在线学习PHP开发(六)数据库

    数据库管理技术的产生与发展 人工管理,效率低成本高image.png 文件系统阶段image.png 数据库管理阶...

  • 不懂数据的SEMer,不是好竞价员

    万物互联时代,数据成为了竞价员最重要的依据: 点击成本转化成本提高,凸显数据精细化管理的紧迫; 数据爆发与流量昂贵...

  • 价值工程应用

    案例: 某施工单位制定了严格详细的成本管理制度,建立了规范长效的成本管理流程,并构建了科学实用的成本数据库。 该施...

  • 07:项目成本管理12

    成本汇总(P252)成本汇总----汇总路线:活动的成本估算→工作包→控制账户→整个项目。数据分析(P252)管理...

网友评论

      本文标题:数据成本管理

      本文链接:https://www.haomeiwen.com/subject/kdnvqrtx.html