数据湖、数据湖仓和数据编织等集中式数据架构越来越受欢迎,用于控制海量数据并成功数据驱动的决策。但是,该畛域的许多名目面临应战,甚至无法成功预期成绩。
理想上,这些失败面前的一个关键要素是架构师关键关注配置需求而疏忽了雷同关键的非配置性需求。这些非配置性需求,例如可扩展性、性能、安保性和数据品质,关于数据架构名目的成功至关关键。
可怜的是,假设不能充沛满足这些非配置性需求,就会造成名目失败。例如,依据Gartner颁布的一份报告,大概85% 的大数据名目会失败,这通常是因为缺乏钻研和布局,以及架构师漠视了这些关键的非配置性方面。
在本文中,咱们将讨论或者造成数据湖、数据湖仓和数据编织名目失败的经常出现失误。经过了解这些失误并实施预防措施,可以参与成功的时机并最大限制地提高数据名目的价值。
失误 1:缺乏明白的业务指标和用例
名目失败的关键要素之一是缺乏明白的业务指标和用例。假设没有明白的目的和与组织指标的分歧性,名目或者会缺乏方向并且无法发生无心义的成绩。
例子:
构想一下,ABC 公司想要建造一个渺小的仓库来寄存他们一切的物品。但他们没有方案好要用它做什么,而是始终地参与越来越多的物品。衣服最后堆在电子产品旁边,家具堆在箱子上——一片凌乱!
当没有明白指标时,数据湖、数据湖仓和数据编织就会出现这种状况。ABC 公司的数据处置方案最终取得了各种各样的消息,但没有人确切知道他们须要这些消息做什么。不同的人想要不同的物品,数据并没有依据任何人的特定需求启动组织。最后,数据处置方案更像是一个渣滓抽屉——很难找就任何有用的物品!
预防措施:
失误二:数据控制和数据品质保障无余
漠视数据控制和数据品质会造成无法靠的见地并阻碍决策。数据控制通常无余和数据品质差会造成对数据架构失去信赖,从而造成名目失败。
例子:
ABC 公司将其数据处置方案构建为办公室的公共冰箱。任何人都可以参与任何他们想要的物品,无需审核或贴标签。这象征着优质食品最终会与奥秘的容器和过时的酸奶放在一同。没有人知道他们能信赖什么,所以没有人用冰箱来做任何关键的事件。
雷同,ABC 的数据处置方案也因没有数据“规定”而遭到影响。不准确或不分歧的消息最终混入了好消息中。因为没有人知道该置信什么,有价值的数据变得毫无用途。假设对数据不信赖,ABC 就无法依据数据做出正确的决策。
预防措施:
失误 3:数据集成不良和数据管道无余
数据集成是集中式数据架构的一个关键方面。假设数据集成处置不当,名目或者会失败,从而造成数据孤岛、数据不分歧和数据可访问性受限。
例子:
ABC 公司方案举行一场隆重的团聚,但他们没有布置主人和食物的顺畅流动,而是依托人们一件一件地搬运物品。这形成了凌乱!来自不同部门(营销、开售)的人最终把他们的零食(数据)藏了起来。任何零食(见地)都花了很长期间才抵达团聚(决策),一些美味的食物(有价值的数据)甚至从未送达!
预防措施:
失误4:漠视安保和隐衷措施
不适当的安保和隐衷措施或者会使敏感数据泄露给未经授权的访问,并侵害数据完整性。未能优先思考安保和隐衷或者会造成名目因不恪违法规和失去信赖而失败。
例子:
ABC 公司的数据处置方案就像没有保安的公共公园一样。任何人都可以走出来拿走他们想要的任何物品!这象征着敏感消息(如客户地址和购置历史)会泄露给任何路过的人。这不只会造成数据被盗,还会让 ABC 公司看起来对团体消息不担任任。他们甚至或者惹上法律费事!
就像公园须要安保措施来包全人们及其财物一样,数据处置方案也须要安保措施来包全敏感数据。假设没有适当的包全措施,有价值的消息就会面临风险,公司自身也或者面临法律结果。
预防措施:
失误5:疏忽可扩展性和性能要求
数据架构必定设计为能够处置始终增长的数据量和用户需求。漠视可扩展性和性能思考或者会造成瓶颈、查问照应期间迟紧张系统缺点。
例子:
构想一下,ABC 公司建了一个小棚子来寄存他们的园艺工具。但他们对园艺的热爱造成他们搜集了少量设备!棚子很快就堆满了物品,耙子和铲子缠在一同,软管堵住了门。试图找就任何物品都成了一件令人丧气的苦差事。
雷同,ABC 的数据处置方案并非为处置日益增长的消息量而构建的。随着他们搜集的数据越来越多,系统变得超负荷。就像满溢的仓库一样,您须要花很长期间才干找到所需的任何内容(查问照应期间缓慢),有时系统会齐全解体(系统不稳固)。这使得它无法跟上始终增长的数据流。
预防措施:
失误6:缺乏利益关系者的介入和用户驳回
成功的数据架构名目须要利益关系者的踊跃介入和用户的接受。未能让利益关系者介入并确保用户接受或者会造成阻力并阻碍名目的成功。
例子:
构想一下,ABC 公司建造了一座渺小的图书馆,但却从未通知过任何人!他们在书架上摆满了书,但没有人知道这些书在那里。人们始终去他们相熟的老书店(电子表格和报告)失掉消息。新图书馆(数据处置方案)依然空着,无人经常使用。
当利益关系者(不同部门)没有介入构建数据处置方案时,就会出现这种状况。ABC 构建系统时没有征询用户(员工)他们实践须要什么消息。结果,没有人知道如何经常使用数据处置方案,甚至不知道它的存在!假设没有用户驳回,处置方案中的贵重数据将无法失掉应用,无法用于做出更好的决策。
预防措施:
失误七:变卦控制和名目控制无余
漠视变卦控制和名目控制会影响进展并造成名目失败。假设没有适当的监视和控制,名目或者会面临延误、范围蔓延和缺乏问责制。
例子:
构想一下,ABC 公司选择创新他们的厨房。他们首先撤除墙壁,但因为没有明白的方案或担任人,事件很快就变得一团糟。他们始终参与新想法(购置精巧的烤箱,装置天窗),却遗记了最后的指标(修缮漏水的水龙头)。这个名目迁延了很久,破费远远超出预期,而厨房依然无法经常使用。
与 ABC 的厨房革新相似,没有适当变卦控制的数据处置方案名目是劫难的根源。没有明白的方向(名目控制)和明白的步骤(变卦控制),名目就会失去重点。新配置和恳求(范围蔓延)始终参与,造成延误和老本收缩。没有人知道谁担任什么,造成凌乱,最终造成名目失败。数据处置方案最终无法经常使用,就像半拆毁的厨房一样。
预防措施:
小结
防止这些经常出现失误关于数据湖、数据湖仓和数据架构名目的成功至关关键。经过处置与业务指标、数据控制、数据集成、安保性、可扩展性、利益关系者介入和名目控制关系的疑问,您可以降落风险并提高成功预期结果的或者性。采取预防措施,依据详细名目状况启动调整,并继续监控和改良数据架构方案,以充散施展数据资产的后劲。