说明通过注释学习MIMIC官方的查询语句,总结MIMIC数据库的结构和查询特点。
内容:SQL语言和mimic-iv数据库的结构
目的:通过学习mimic数据库的数据格式, 方便查询mimic数据库; 学习mimic数据库的组织形式,也能够建立并查询自己的数据库
概念和特点:
本文的许多概念和对mimic数据库的认识来源于:[1] Wang S , Mcdermott M , Chauhan G , et al. MIMIC-Extract: A Data Extraction, Preprocessing, and Representation Pipeline for MIMIC-III[J]. 2019. 并参考了通用的CDISC的相关知识。
- 静态数据, 没有时间因素的影响,多是分类变量,比如,年龄,性别等。
- 静态表格,整个表格的数据是一个模式,,为静态,通过表格连接汇总成横向的单个表格。
- 动态数据, 多条记录, 通常是随时间的不同而变化。
- 动态数据表格,每个动态表格中保存的数据都是一类, 都有多条记录,规律:其中有2-3列是“核心列”,一般是测试的名称(itemid)和测试的值(valuenum和value)是查询的主体;其余的列是辅助列,包括时间,flag等 辅助因素。
**特殊的提取策略:**比如年龄的提取,有专门的公式来进行换算,查询策略也特殊。
例:
一般的提取策略:
静态数据的提取:
1.一般策略:按照文献的策略提取并存入到表格; 一般查询,使用加减函数(比如出院时间减去入院时间,获得住院时长等)
2. 静态数据表格有(方便查询): mimic_core.admissions(缩写ad);mimic_core.patients(pa);mimic_core.transfers(); mimic_hosp.diagnoses_icd (diag)
附例:静态查询语句实例+标注
评论:1.查询命令相对简单, 不涉及复杂的换算;
动态表格数据的提取:
- 动态表格有哪些?mimic_icu.chartevents(缩写ce); mimic_hosp.labevents(缩写le);
基本策略:
step 1.多条数据变为单条数据,通过求平均值,首次值或末次值,中位数,频数等(使用聚合函数);
step 2.纵向数据变横向数据。
step 3.连接表格。
多次测量的数据有分为多个具体情形:
- 心率等生命体征和实验室检查, 求平均值比较合适;
- 频次
附:随时间变化的变量的SQL查询典型语句学习(原始语句来源于micmic官方公布的github中的语句, 略微改动):
例2 提取CRRT治疗的相关参数,代表了治疗相关的参数查询
例3 炎症指标的查询,代表了实验室指标的查询过程
例:这是一个比较综合的例子, 查询charlson 合并症的相关资料, 通过ICD-9和10限定相关的疾病。
以上就是本篇文章【MICMIC-IV 个人查询策略(+官方查询语句注释)】的全部内容了,欢迎阅览 ! 文章地址:http://dfvalve.xrbh.cn/news/4276.html 资讯 企业新闻 行情 企业黄页 同类资讯 首页 网站地图 返回首页 迅博思语资讯移动站 http://keant.xrbh.cn/ , 查看更多