数据治理是所有数据应用的根基,数据治理的好坏直接影响所有数据应用的价值。当前企业数据治理面临着各种难题,主要表现为以下6个方面:
1、数据分散,形成孤岛:“烟囱式”项目建设,导致数据分散在不同系统中,彼此之间无法形成联结。
2、异构数据源,难以统一管控:各个系统由于应用场景差异,选用不同种类的数据库,导致异构数据源之间难以统一管控。
3、数据质量问题严重:数据建设过程中,应用层数据多出现指标口径管理规范不统一,数据一致性无法保证,同名不同义、同义不同名的现象频发。
4、数据成本增长过快:据统计,部分业务出现大数据存储和计算资源的机器费用占比已经超过了成本35%,如果不加以控制,大数据成本只会越来越高。
5、数据安全缺乏保障:各业务线之间存在共用的数据较多,且各业务线没有统一的数据权限管控标准,存在数据安全隐患。
6、开发标准规范缺失:由于缺乏相应的开发规范约束,且数据工程师的工作思路和方式差异性都非常大,导致数据仓库内的重复数据多,规范性较差。