报表里有4个SQL数据集但报表查完很慢该怎么办
今天就跟大家聊聊有关报表里有4个SQL数据集但报表查完很慢该怎么办,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
成都创新互联公司是一家专注于做网站、网站制作与策划设计,涞水网站建设哪家好?成都创新互联公司做网站,专注于网站建设十载,网设计领域的专业建站公司;建站业务涵盖:涞水等地区。涞水做网站价格咨询:028-86922220
你要确认一下执行完 SQL 结果是否都加载了,像 PL/SQL Developer 查完就只加载部分。
不过报表运行时间肯定是要比数据库查 SQL 慢的,如果慢很多可能是因为在报表里关联多个数据集导致的。可以检查一下在报表单元格里是否有类似:ds2.select(name,id==ds1.cusid) 这样的表达式,表示数据集 2 和数据集 1 通过某个字段实现关联。
几乎所有报表工具在完成多数据集关联时都采用顺序遍历的方式实现,先拿一个数据集的第一条记录去第二个数据集中遍历查找符合条件的记录,然后是第二条,第三条…,数据量大的时候性能就会很低。画个图看一下:
在报表里关联这两个数据集就要遍历数据集 ds1 记录数(100 万)次数据集 ds2,总共比较 100 万 *1000 次。。。速度当然慢了。
要解决这个问题,得想办法把关联计算改到为报表准备数据那个阶段,方法有两个。
一、用 SQL 完成原来 4 个数据集的关联
写个复杂 SQL,把原来 4 个数据集的 SQL 整合成一句,让数据库完成关联计算(HASH JOIN),这样会快很多。当然这种做法有几个限制:
1、 不能跨库。如果原来的 4 个数据集来自不同数据库,就不能这么干了。异构源当然也不行;
2、 不能有存储过程。改造存储过程的成本太高,而且需要相应数据库权限;
3、 SQL 太复杂不好整合。有时报表的数据集 SQL 都很复杂,还带有很多参数(报表传过来的),很难整合到一起。其实这正是报表里要用多数据集的原因,报表工具支持多数据会带来很多方便,但会影响性能。
二、直接用带强计算能力的报表工具
有一些报表工具带脚本计算能力,这样就可以事先关联完多个数据集。这样就改变了原来要么在数据库里关联(很多情况没法实现),要么在报表模板里关联(性能太低)的状况,性能往往能提升几倍到几十倍。
这个文章介绍了详细的实施过程: 如何提高多源关联报表性能 ,里面举的三个例子性能分别提升了 5 倍、26 倍和 44 倍,效果比较明显。
而且,这个工具有了脚本能力还支持跨库,文件、NOSQL 这些数据源,也能调用存储过程,解决了数据库面临的那些问题。
看完上述内容,你们对报表里有4个SQL数据集但报表查完很慢该怎么办有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注创新互联行业资讯频道,感谢大家的支持。
当前标题:报表里有4个SQL数据集但报表查完很慢该怎么办
转载来于:http://cdiso.cn/article/pishps.html