应对没完没了的报表开发

应对没完没了的报表开发 – esproc for reporting | 润乾 -pg游戏官网登录入口

简单开发 · 丰富格式 · 多样源 · 轻量级 · 高性能

esproc 报表方案

技术架构

与报表工具/java应用无缝结合

esproc纯java开发
  • 轻量级
  • 嵌入式,无独立服务器
  • jvm,jdk1.8及以上
  • vm/container/android

开发提效

易于开发调试的网格编程

简化报表复杂sql

报表目标查询销售额占总额一半的大客户及订单情况

sql

select customer, amount, sum_amount
	from (select customer, amount,
		sum(amount) over(order by amount desc) sum_amount
			from (select customer, sum(amount) amount
	   			from orders group by customer))
	   			where 2 * sum_amount < (select sum(amount) total from orders)

spl

ab
1=db.query("select customer,amount from orders order by amount desc")
2=a1.sum(amount)/2 =0
3=a1.pselect((b1 =amount)>=a2)return a1.to(a3)

更复杂的sql

报表目标统计每天新用户的次日留存情况

sql

with first_login as ( 
    select userid, min(trunc(ts)) as first_login_date  from login_data group by userid),
next_day_login as (
    select distinct(fl.userid), fl.first_login_date, trunc(ld.ts) as next_day_login_date
    from first_login fl left join login_data ld on fl.userid = ld.userid where trunc(ld.ts) = fl.first_login_date   1),
day_new_users as (
    select first_login_date,count(*) as new_user_num from first_login group by first_login_date),
next_new_users as (
    select next_day_login_date, count(*) as next_user_num from next_day_login group by next_day_login_date),
all_date as (
    select distinct(trunc(ts)) as login_date from login_data)
select all_date.login_date 1 as dt,dn. new_user_num,nn. next_user_num,
      (case  when nn. next_day_login_date is null then 0  else nn.next_user_num end)/dn.new_user_num as ret_rate
from all_date join day_new_users dn on all_date.login_date=dn.first_login_date
    left join next_new_users nn on dn.first_login_date 1=nn. next_day_login_date
order by all_date.login_date;

spl

a
1=file(“login_data.csv”).import@tc()
2=a1.group(userid;fst=date(ts):fst_login,~.(date(ts)).pos(fst 1)>0:w_sec_login)
3=a2.groups(fst_login 1:dt;count(w_sec_login)/count(1):ret_rate)

丰富格式报表

制作复杂报表比birt/jasperreport更简单

多源混算

多数据源报表

  • 原生数据源接口直接访问,无须事先定义映射关系,保持数据源特性
  • 轻量级,避免沉重的逻辑数仓

多源混算应用 — 实时报表

  • 历史冷数据由ap库计算后读取
  • 交易热数据实时从tp库读取
  • 混合计算实现全数据实时报表

跨库移植

一句sql,到处运行,换数据库不改报表

跨库移植-转换实例

select eid, name, birthday, addmonths(birthday,10) day10 from emp
⇩ esproc转换 ⇩
select eid, name, birthday, birthday numtoyminterval(10,'month') day10 from emp
select eid, name, birthday, dateadd(mm,10,birthday) day10 from emp
select eid, name, birthday, birthday 10 months day10 from emp
select eid, name, birthday, birthday interval 10 month day10 from emp
select eid, name, birthday, birthday interval '10 months' day10 from emp
select eid, name, birthday, add_months(birthday, 10) day10 from emp

文件数据源

没有数据库也能用sql
$select * from orders.csv where client like '%bro%’ ;

$select o.orderid,o.client,e.name e.dept,e.eid from orders.txt o
left join employee.txt e on o.sellerid=e.eid;

$select * from {file("orders.txt").import@t(;":")}
where amount>=100 and client like 'bro' or orderdate is null;

$select * from orders.xlsx
where amount>=100 and client like 'bro' or orderdate is null

$select * from {json(file("data.json").read())}
where amount>=100 and client like 'bro' or orderdate is null

$select * from { httpfile("http://127.0.0.1:6868/orders.csv").import@tc() }
where amount>=100 and client like 'bro' or orderdate is null

架构优化

报表微服务

报表微服务

  • 报表数据源以微服务形式提交,易于扩展移植
  • esproc脚本解释执行,天然支持热切换
  • 适应多变的报表业务

存储过程替代

存储过程替代

  • 存储过程迁移到库外,不依赖于数据库,天然可移植
  • 降低应用间耦合性
  • 无须编译存储过程权限,提升安全性和可靠性

消除数据库中间表

消除数据库中间表

  • 中间表转储到文件存储和计算,减轻数据库负担
  • 树形结构的文件系统易于管理,降低应用间耦合

性能提升

多线程并行取数

多线程并行取数,同构异构库均可,提高查询效率

单表并行取数:

ab
1fork to(12)=connect("oracle")
2=b1.query@x("select * from   customer where mod(c_custkey,?)=?", n, a1-1)
3=a1.conj()

多表(多库)并行取数:

ab
1select * from supplier
2select * from part
3select * from customer
4select * from partsupp
5select * from orders
6fork [a1:a5]=connect("oracle")
7=b6.query@x(a6)

简易的大数据与并行计算

内存
外存

大数据

a
1=file(sales.txt).import@t()
2=a1.select(od>=20240101)
3=a2.groups(area,emp;sum(amount):amount)
a
1=file(sales.txt).cursor@t()
2=a1.select(od>=20240101)
3=a2.groups(area,emp;sum(amount):amount)

并行计算

a
1=file(sales.txt).import@tm()
2=a1.select(od>=20240101)
3=a2.groups(area,emp;sum(amount):amount)
a
1=file(sales.txt).cursor@tm()
2=a1.select(od>=20240101)
3=a2.groups(area,emp;sum(amount):amount)
加个选项就能并行,快速提升计算性能

本地文件数据缓存

本地文件数据缓存

  • 文件系统io更快
  • 二进制格式无须解析
  • 高性能支持:压缩、列存、索引、…

高性能算法

遍历技术

  • 延迟游标
  • 聚合理解
  • 有序游标
  • 遍历复用
  • 预过滤遍历

高效关联

  • 外键指针化
  • 外键序号化
  • 有序归并
  • 附表
  • 单边分堆连接

高速存储

  • 有序压缩存储
  • 列式存储
  • 层次序号式定位
  • 索引及缓存
  • 倍增分段并行
提高报表计算性能

更多资源

网站地图