总体概述
实施中痛点
全过程参与:实施人员需要参与数据采集、清洗、转换、分析主题设计、BI工具图表设计整个全过程
对人员能力要求高:懂业务、懂技术、懂管理
数据分析结果由实施人员能力决定:太多的算法在程序脚本中,没有公开化
目标
实现BI指标的计算与配置和BI图表展示分开
实现实时的数据的全量分析
关注点
计算方法:通过指标计算方法配置自动生成分析模型中指标值,而不需要关注如何从业务数据中获取指标值的计算SQL实现
数据质量标准:通过数据质量标准制定,在数据采集过程中形成经治理的数据湖数据,而不需采用数据后治理方式进行数据清洗转换
最终展示效果:通过拖拽方式实现最终效果的实现,获取数据时只需要关注数据汇聚的方式
特点
BI指标配置和计算与BI图表展示分开
实现BI实施工作角色清晰地划分
高性能
传统方式:建模,建维度表,或提前生成分析文件
解决办法:引入ClickHouse列式数据库,聚合性能非常高
丰富的集成平台工具能力集
BI分析模型数据来源据源湖,集成交换生成已经治理的数据湖数据
BI展示时,可以报表工具配合起来用,实现宏观到微观分析实现
基本概念
数据应用配置
指标
指标:BI分析最小粒度单元或医疗实体不可拆分的属性,分为医疗实体指标和BI分析指标
医疗实体指标
原子不可分割的指标,他可以组合形成新的BI分析指标
BI分析指标
对医疗实体指标进行组合、汇聚形成的最终用户展示的指标
医疗实体指标分类
业务类指标:指标值可以直接从业务数据中获取的指标,比如住院费用、门诊人次、住院人次等
资源类指标:以人、财、物作为要素定义的指标,数据值一般以年为周期变化,比如核定床位数、医师人数等
医疗类指标:以病人某次就诊为主体的实体画像属性,分门诊住院两大类别,如急性心肌梗死死亡人数
计算类指标:利用数据库函数实现数据计算的指标
医疗实体
定义
从统计分析的角度来确定的BI分析模型
医疗实体的属性通过定义指标实现
医疗实体实际是由很多指标构成的一个宽表,是BI展示的获取数据的来源
特征:依据最小业务粒度来定义医疗实体,方便BI展示分析只需要对医疗实体数据作简单聚合 就可以实现分析意图,同时保留业务数据的最小粒度,实现分析数据从宏观到微观的观察
例子1 门诊费用实体:以某条费用作为参考,扩展相关的分析指标:病人ID、就诊序号、项目编码、项目名称、数量、 单价、金额、费用类别(药品、非药品)、药品类别(西药、中成药、中药)、剂型、自费药、贵重、 毒麻、大输液、进口药、基药、抗毒药物、辅助用药标志等指标
医疗实体画像:
根据医疗实体定义信息,由医疗实体画像计算服务根据指标不同类型计算指标数据值生成医疗实体宽表数据的过程称之为医疗实体画像
BI展示配置
数据视图:制作数据图表从ClickHouse或其它数据库准备的查询SQL
数据图表:特定业务分析时设计的图表展示模型,它不是最终用户的呈现方式
仪表板:为了展示全面充分,把某一主题分析下的一个或多个数据图表组合在一块进行最终用户展示效果
演示:通过组合一个或多个仪表板形成大屏系统。
内置医疗实体
资源配置床位与人员:资源类的医疗实体
住院医疗服务能力与单病种
住院诊断
住院手术
住院医属
住院费用
门诊就诊
门诊处方
门诊费用
门诊挂号
住院病人就诊信息
门诊发票
住院发票
实施流程
实施角色介绍
数据采集工程师
数据集的设计、分析、固化;数据的适配、采集、数据质量的校验。
指标工程师
分析医疗指标与医疗实体;配置医疗指标与医疗实体;核对医疗指标与医疗实体。
BI展示配置工程师
BI前端界面制作、授权的工程师
实施流程
分析、设计阶段(数据采集工程师、指标工程师)
理解指标定义:1、从管理的角度理解指标的意义;2、分解指标的计算逻辑
分析业务数据来源
分析指标值所涉及到的业务场景
确定业务数据接入方式
1、接口方式
2、适配器方式
CDC
视图模式
前置机模式
3、导入方式
4、表单填表
分析数据集:分析指标所涉及到的数据集(包括子集及子集的数据项)
分析指标类型:确定指标值从业务场景中获取值的计算方式,确定指标类型
分析医疗实体:根据指标类型把指标作为某一个医疗实体的画像属性。例如手术患者 手术后猝死发生例数和发生率,它有两个指标:一个是手术例次;一个是手术后猝死数, 这两个指标都可以作为住院医疗服务能力与单病种这个医疗实体的画像属性
标准固化(数据采集工程师、指标工程师、参考标准化文档)
固化信息模型:把分析阶段输出的数据集通过平台的信息模型管理工具固化到系统中
配置指标:根据分析阶段输出的指标与类别在指标配置系统中进行配置。
配置医疗实体:根据指标类型在医疗实体功能模块中进行新建或修改对应医疗实体, 使新建或修改的指标在系统中生效,使指标成为医疗实体的画像属性
采集配置阶段(数据采集工程师、参照适配端文档)
接口改造API
第三方API改造
数据核对
适配器模式
接入配置
数据核对
导入方式
导入程序配置
数据导入与数据核对
表单方式
表单程序配置
数据录入与核对
展示配置阶段(BI展示配置工程师)
配置数据源:在数据源功能模块配置clickhouse数据库地址
配置数据视图:在数据视图功能模块编写相关SQL
步骤
确定数据视图目录分类
配置查询SQL
说明
1、查询SQL尽量不要出现汇聚方法,汇聚在数据图表中进行配置
2、不要的查询列禁止出现在SQL中
3、查询时间用全局变量,尽量不要配置私有变量
4、尽量不用多表关联查询
5、多组织机构时需要加相应条件
6、尽量不要再SQL中出现虚列(计算列),可以通过再医疗实体中增加医疗实体指标
配置数据图表:在数据图表功能模块进行设计和制作
确定分类信息
设计图表
图表类型确定
图
表格
环比
同比
维度确定
维度值(指标)确定
人工聚合(配置计算公式)
聚合方法在计算公式中实现
系统聚合(设置聚合类型)
样式确定
上卷下钻设置
同类别不同维度
举例
从年、季、月、日四个维度查看心肌梗死人数占比
四个维度中的心肌梗死人数占比属于同类别
配置仪表板:在仪表板功能模块进行仪表板设计和制作
配置仪表板分类信息
同类别的指标放置到一个仪表板
配置仪表板
控制器设置
查询条件类
时间控制器相对时间设置
数据过滤类
功能类
联动设置
在同一个维度中观察另一种类别的数据
举例
按时间(年、季、月、日)查看费用数据时同时关注科室的费用
按科室查看费用的时候查看医师的费用
跳转设置
仪表板
内部报表
分享跳转
分配权限(BI展示配置工程师)
角色授权:定义角色、授权角色权限
人员授权:授予人员角色权限
练习
指标设计
业务类指标:住院病人总费用
资源类指标:核定床位数
计算类的指标:门诊费用增加基药指标
医疗指标:住院医疗服务能力与单病种增加急性心肌梗死死亡指标
医疗实体设计
门诊费用医疗实体设计
展示配置
参照急性心肌梗死目前的仪表板增加一个同样的仪表板
1、增加数据视图
2、增加数据图表
3、增加仪表盘