• 数据孤岛是什么
  • “企业发展到一定阶段,出现多个事业部,每个事业部都有各自数据,事业部之间的数据往往都各自存储,各自定义。每个事业部的数据就像一个个孤岛一样无法(或者极其困难)和企业内部的其他数据进行连接互动。”我们把这样的情况称为数据孤岛。
    • eg : 财务部门对性别的定义是 man 代表男性 woman代表女性 。人力部门定义 1 代表男性 2 代表女性 数据标准不一,数据类型不一,数据长度也不一
  • 简单说就是数据间缺乏关联性,数据库彼此无法兼容。
  • 专业人士把数据孤岛分为物理性和逻辑性两种。物理性的数据孤岛指的是,数据在不同部门相互独立存储,独立维护,彼此间相互孤立,形成了物理上的孤岛。逻辑性的数据孤岛指的是,不同部门站在自己的角度对数据进行理解和定义,使得一些相同的数据被赋予了不同的含义,无形中加大了跨部门数据合作的沟通成本。
  • 一般来说,企业信息化发展有三个阶段:
    • 1.基于设备的建设,
    • 2.基于项目的建设,
    • 3.基于战略的建设。
    • 在第二阶段必然会产生信息孤岛,把这些孤岛连接起来从技术上还是可以实现的,但关键的难题就在于不同部门针对于相同数据的值可以不同,这也就是我们说得污染,我们很难有自动的方法可以区分出来哪些是“正确”的数据,这是导致解决这些信息孤岛失败的主要原因
  • 解决数据孤岛问题的方案步骤
  • 1、编制IT建设的标准,仍然允许部门自行开发软件业务系统;
  • 2、给ITC明确的定位,使其有成长和发展的空间,编制IT发现的战略,我们需要明确哪些软件项目是暂时性的,那些是长期地,并把它作为项目立项的依据之一;
  • 3、在合适的时机,对企业的主要业务流程进行整合,根据这样的流程,结合战略,把不同的业务系统串接起来;(数仓建设)
  • 4、与3同时,我们需要在IT的建设、维护责任与业务部门有明确的责任界定;
  • 5、这是一项长期的工作。

作者 admin

张宴银,大数据开发工程师

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注