如何把握区分必须实时,最好实时,不必全部实时的分寸了?想避免每个单独的信息在实时数据集市中实时刷新的想法是很困难的。大多数的实时商业智能的解决方案可以分成全部实时,非全部实时。你要能,并且必须能区分哪些信息元素要全部实时,执行实时的时间是一天,一周,或者是一个月刷新。
考虑一下一个销售的解决方案,这个方案实质上就是每月生成报表,本年度截止到现在的销售情况。当源应用程序有一些改变时,数据集成引擎将要把这些销售变量加入到实时数据市场,计算出相应的结果。但是,在这个解决方案中,员工这个变量因素的刷新频率有多少了?
让我们假设员工这一因素的一些属性从一个人力资源的应用程序得来,这个人力资源应用程序反应员工的偶尔变化,这些数据元素对销售分析并不是很至关重要。那么在这个解决方案中,或许就可以将员工这一因素分成两个成分。从事务系统中得到一些必要的员工信息(如员工ID等)。至于其它的属性如办公地点就可以放在一边。这中安排就可以减少实时ETL过程加载量。同样的,如果你只需要一些月报告的快照,你就可以每月构建一次。
在实时商业智能解决方案中你需要设计一个瘦的数据集。针对每个刷新频率绘制一条线,决定那些信息应该是实时的,那些能够让其等待是成功实时数据集市解决方案的关键。在进行分析和高水平设计阶段,这些需要尽快解决。
二、不要弄巧成拙从任何源应用程序捕获数据最简单的方法就是实时读入源系统数据。但是,并不是有很多的应用管理程序允许你这么做。因此访问源应用程序的选择是很有限的。
大多数的实时集成工具有一个实时数据复制引擎。和这个引擎一起有一个单独的价格标签。这个实时数据复制引擎影响到数据库日志。有了这样的一个工具就可以让开发团队的工作轻松,有数据库提供商提供的数据库本地复制器将会是一个简单,有效节约成本的解决方案。这种实时数据收集的另一种替代方案就是使用数据库触发器。如果这种选择没有使得院系统在性能和维护上负担加重,比起使用单独的工具,这将是一个好的候选办法,因为成本和维护费用更低。在不影响源系统性能的前提下,这种触发器可以提交在源系统的变化信息到一个单独的集结地,而实时数据集成引擎能不间断的从这个集结地去读信息。
一些需要从多种系统整合的数据容量和刷新周期,能够方便的由标准的ETL刷新策略所处理,这些策略包括数据库触发器,复制和其它一些机制。即时这里出现交替机制需要等待几分钟,可以考虑实施单独的实时复制工具。三、进行信息图像化商业智能解决方案最紧要的就是实时移交信息。因此提供一个可视化的图案就更好了。由于商业智能中数据可视化重要性越来越受关注,分析仪表板不再认为是一个可有可无的工具了。当可以以数字化,统计来呈现一个事实的时候,有仪表板就会更好,就像企业拥有了一只鸟的眼睛,对事实的把握程度更准确。
信息发布:广州名易软件有限公司 http://www.myidp.net