数据集标准制定
设计数据集标准
按照数据集模板进行数据项填入
合理性设置
必要的数据项
病人相关数据集需要设计时需要关键信息
病人ID:DE02.01.062.47
就诊流水号:DE05.01.081.02
医疗机构代码:DE08.10.052.00
与文档相关的数据集需要设计时需要关键信息
病人ID:DE02.01.062.47
就诊流水号:DE05.01.081.02
医疗机构代码:DE08.10.052.00
文档访问地址:DE01.00.018.08
业务主键
索引字段
就诊流水号
数据元类型与长度
字符串
长度以32为基数扩充
超过4000的用clob
数字
程序中是长度包含精度
日期
标准格式yyyy-mm-dd hh24:mi:ss
业务系统只有时间或者日期时,需要按标准格式进行拼接
数据元值域范围
有国家标准按国家标准
没有国家标准可扩充
非空
评审
找三个以上的业务专家评审
固化
结对固化
数据适配
确定适配的数据集
下载数据集元数据(在信息模型管理中的数据元)
分析业务数据库
把分析结果填入数据子集标准中
评审
找医院信息中心核实
固化
结对固化
对于值域的只能用公有值域转换或者私有值域转化
源表中文名称改成业务数据库相对应的中文注释
源库的表字段要写成中文
单机构的时候组织机构代码不进行匹配
历史数据采集
初次历史数据采集
采集的开始时间或者采集的最小自增序号
CDC
数据采集完成之后要把查询条件类别改成CDC
重复历史数据采集
BI医疗实体同步先暂停
清空数据中心相关表
blob字段对应的表清空
数据上传完成核对
文件消息是否全部入库
BI医疗实体初始化同步
指标配置与核对
配置
核对SQL
SQL基本要求
能用工具配置的不写手工SQL(方便知识传递减少对个人依赖)
所有的子查询里边都要加上rownum=1或者limit 0,1
核对语法
rowcode=?
错误的表达方式
rowcode和?中间有空格
rowcode写成大写
只取一条的语法
orcale
and rownum=1
and rownum中间只能有一个空格
rownum和1之间不能有空格
不能用大写
TiDB
limit 0,1
不能用大写
limit和0,1之间只能有一个空格
核对性能
所有的子查询不能有全表扫描
性能分析
耗时建议不能超过20ms
字节数建议不超过100字节
相关说明
做了指标一定要做BI图表
如果跟人相关一定要有列表与业务表单的详细展示
指标数据核对
指标数据查询方法
某个人
把指标中最终的SQL t.rowcode=?改为t.clinic_sn='具体的人员clinic_sn'
时间段
把指标中最终的SQL t.rowcode=?改为t.out_hosptial_date>=? and t.out_hosptial_date<=?
源端数据不正确
前提
填报数据反馈不正确
BI图表直观反馈出来问题,但指标计算方法没问题
通过指标计算方法核对完成后中心端数据不正确
发现数据源有问题
数据一致性核对
条目数核对
业务库查询数据
数据湖数据核对
数据项核对
不一致时处理
适配器
核对数据项
核对过滤条件
接口
数据湖数据与分析库数据不一致
系统同步
在医疗实体指标配置中的指标同步按钮
特别注意事项
如果指标值对应的数据量大于百分之十建议采用初始化同步
1、医疗实体暂停同步
2、修改对应表中的source_date、sourcetype
参照语句:update 业务表 t set t.sourcedate = t.enterdata, t.sourcetype = 'I' where t.sourcetype = 'U'
3、医疗实体初始化同步
人工同步
CK中本来只出现一条病人数据,但出现多条
更新时sourcetype没有改为U
更新数据湖数据时间(当前时间与之后的数据)与数据变化状态为U
少于10条数据,source_date直接更新为当前时间
多于10条:select tt.sourcedate,sysdate+ (trunc(rownum/10)/(24*60*60)),trunc(rownum/10) from T_WM_HOMEPAGE tt where 条件
Datart核对
数据视图
数据图表配置
仪表盘
二级链接地址
三级链接显示内容
评测系统配置核对
评测系统子指标配置
配置原则
根据评测指标的公式进行配置
如果没有分母
简单指标,指标编码为评测系统编码
重点配置项说明
虚指标
组合生成评测系统指标
评测系统聚合方式
指标系统生成指标的特点
评测指标子指标的含义
评测系统分组方式
查询条件
找到具体的指标画像属性
组合指标
定义:不通过指标系统直接计算获得指标值
报表地址配置
分子报表地址:生成报表地址功能在指标取数据方法为系统统计的指标,同时报表地址没有设定
分母报表地址:生成报表地址功能在指标取数据方法为系统统计的指标,同时报表地址没有设定
报表名称:如果配置了报表名称,生成报表地址不再重新生成