重复测量数据多重填补 SAS code|电子爱好者

admin管理员组
文章数量:1660166

临床试验长期随访数据中，缺失数据的利用和处理是经常遇到的问题，本文将围绕MMRM模型和delta法多重填补进行举例

文章目录

前言
- `本文主要介绍多重填补的操作步骤，对相应原理不进行介绍：`
一、模拟生成数据集
- 1. 生成无缺失值的数据集
- 2.模拟存在访视缺失数据集
二、MMRM模型
- 1.数据库整理
- 2.MMRM模型分析
三、delta方法多重插补
- 1.数据格式转换
- 2.多重填补思路
- - (1) 判断缺失情况并进行数据填补
  - （2）数据分析
  - （3）合并结果
总结
Reference

前言

`本文主要介绍多重填补的操作步骤，对相应原理不进行介绍：`

一、模拟生成数据集

1. 生成无缺失值的数据集

代码如下：

*Format for visit;
PROC FORMAT;
 VALUE vis 1 = 'BL'
 7 = 'DAY 7'
 14= 'EOT'
 28= 'FU D28'
 42= 'FU D42'
 98= 'FU D98';
RUN;
/* Core data simulation */
DATA dd1;
 LENGTH subjid trtp $7. paramcd $4. param $17.;
 *Visit structure;
 ARRAY visits (6) _TEMPORARY_ (1 7 14 28 42 98);
 *Sets seed for all rand functions ;
 CALL STREAMINIT(1977);

 *Data simulation loop;
 DO id = 1 TO 200;
 *Assign subject id;
 subjid='101-'||PUT(id, Z3.);
 *Assign gender;
 IF RAND('Bernoulli', 0.5) = 1 THEN sex='M';
 ELSE sex='F';
 *Assign treatment group;
 IF RAND('Bernoulli', 0.5) = 1 THEN trtp='Active';
 ELSE trtp='Placebo';
 *Assign age;
 age=ROUND(RAND('Normal', 50, 15));
 *Assign result name and short code;
 paramcd='MIDI';
 param='Midichlorians (n)';
 *Simulate results;
 DO i=1 TO DIM(visits);
 avisitn=visits(i);
 avisit=PUT(avisitn, VIS.);
 IF trtp='Active' THEN DO;
 *Produces advancing treatment effect over time;
IF visits(i)=1 then aval=ROUND(RAND('Normal', 10000, 100));
 ELSE aval=ROUND(RAND('Normal', 10000, 100)+visits(i));
 END;
 ELSE DO;
 *Produces no treatment effect for placebo patients;
aval=ROUND(RAND('Normal', 10000, 100));
 END;
 OUTPUT;
 END;
 END;
 DROP i id;
RUN;

生成的完整数据集变量如下：

trp、sex为分类变量，age为连续性变量，共进行了6次访视， aval为每次访视得到的连续变量值。

2.模拟存在访视缺失数据集

代码如下：

*Derive baseline and simulate missing data;
DATA adeff;
 SET dd1;
 BY subjid;
 CALL STREAMINIT(1980);
 *Derive baseline value;
 RETAIN base .;
 IF first.subjid THEN base=.;
 IF avisit='BL' THEN base= aval;
 *Simulate arbitrary missing data pattern;
 IF avisit ne 'BL' THEN DO;
 IF RAND('Bernoulli', 0.08) THEN DELETE;
 END;
RUN;

生成的数据存在访视时点数据的缺失，研究目的为比较最后一次访视相比基线（avisitn=98-base)的变化情况

二、MMRM模型

对于连续纵向变量，当数据随机缺失时，混合效应模型重复测量（MMRM）提供稳定的的估计值，无需特定处理

主要有效性终点较基线变化的分析模型将包括固定效应治疗、性别、年龄、访视和治疗-访视交互作用，以及作为连续固定协变量的基线值。

1.数据库整理

代码如下：

*MMRM for post-baseline;
data ana_p;
  set adeff;
  where avisitn in (7,14,28,42,98) ;
  chg=aval-base;
run;

2.MMRM模型分析

proc mixed data=ana_p(where=( chg ne .));
	class trtp(ref="Placebo")  avisitn sex subjid;
	model chg=base sex age trtp  avisitn trtp*avisitn /htype = 3  ddfm=kenwardroger;
	repeated avisitn / subject = subjid type=un ;
	lsmeans avisitn*trtp / cl diff;
ods output  lsmeans=pls; /*change from baseline to last week**/
run;

最终可得到两组从基线至最后一次访视的最小二乘估计变化

三、delta方法多重插补

1.数据格式转换

代码如下：

*Transpose to horizontal structure;
PROC TRANSPOSE DATA=adeff OUT=onepersub PREFIX=MIDI;
 BY subjid age sex trtp base paramcd param;
 ID avisitn;
 VAR aval;
RUN;

/*检查数据中每个变量的缺失个数*/
proc means data=onepersub nmiss noprint;
var MIDI1 MIDI7 MIDI14 MIDI28 MIDI42 MIDI98;
output out=miss(drop=_type_ _freq_) nmiss=;
run;

数据格式由长转为宽，且可见各次访视存在的缺失情况

2.多重填补思路

多重填补考虑要点如上图，主要包括:

判断缺失状态：缺失假设方面MAR、MNAR、MCAR；缺失类型：单调缺失、任意缺失；缺失变量：连续、分类、计数、有序；依据缺失变量情况采用的填补方法
依据缺失变量（连续、分类等）确定相应的填补方法进行填补
基于填补好的数据进行分析
最终进行汇总分析

整体多重填补思路如下

(1) 判断缺失情况并进行数据填补

/* Multiple Imputation - 3-step process */
*Step 1a - check missing data pattern (arbitrary vs monotone);
PROC MI DATA=onepersub NIMPUTE=0;
 CLASS sex trtp;
 FCS;
 VAR sex trtp age base midi7 midi14 midi28 midi42 midi98;
RUN;

属于任意缺失，且所研究的变量为连续性变量

相应变量的填补方法见下图

其中 fully conditional specification (FCS) 方法对须填补的连续型变量处于任意缺失、协变量包括分类变量和连续型变量效果较好。

假设该变量为非随机缺失 (MNAR).，采用delta-adjusted pattern imputation:结合FCS方法对数据进行填补

代码如下：

*Step 1b - select appropriate method given missing
 data pattern and variables to be imputed;
proc mi data=onepersub out=imputed seed=125 nimpute=50;
class sex trtp;
var sex trtp age base midi7 midi14 midi28 midi42 midi98;
fcs reg;
mnar 
adjust(midi7 / shift=1 adjustobs=(trtp="Active"))
adjust(midi14 / shift=1 adjustobs=(trtp="Active"))
adjust(midi28  / shift=1 adjustobs=(trtp="Active"))
adjust(midi42 / shift=1 adjustobs=(trtp="Active"))
adjust(midi98 / shift=1 adjustobs=(trtp="Active"));
run;

（2）数据分析

填补后的数据基于ANCOVA方法对访视最后一次相比基线变化进行分析

data imputed;set imputed;chg=midi98-base;run;
*Step 2 - Analysis step;
/*ANCOVA*/
proc mixed data=imputed;
by _imputation_;
       class  sex trtp(ref="Placebo") ;
       model chg =base sex age trtp/htype=3 ddfm=kr;
       lsmeans trtp  /diff alpha=0.05;
     ods output tests3 = etest3 diffs=ediffs lsmeans=els;
run;

（3）合并结果

最终得出分析结果

*Step 3 – Pooling step;
proc sort data=els;by trtp;run;
proc mianalyze data=els;
by trtp;
modeleffects estimate;
stderr stderr;
run; 
proc mianalyze data=ediffs;
modeleffects estimate;
stderr stderr;
run;

最终两组结果如下

总结

临床试验中`多次测量数据常采用MMRM模型直接估计缺失值，不进行缺失值填补；
多重填补后的数据可用于敏感性分析以验证结果的稳健性

Reference

Multiple Imputation: A Statistical Programming Story
Using SAS® for Multiple Imputation and Analysis of Longitudinal Data
SAS® V9.4 MNAR statement for multiple imputations for missing not at random in longitudinal clinical trials

本文标签：测量数据 Code sas

版权声明：本文标题：重复测量数据多重填补 SAS code 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1729850935a1215400.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

大型数据集含损坏图OSError: image file is truncated和PIL.UnidentifiedImageError: cannot identify image file解决方案

2天前

大型数据集包含损坏图片，报错OSError: image file is truncated 和 PIL.UnidentifiedImageError: cannot identify image file的解决方案

ESP8266接入百度智能云平台实现温湿度数据可视化，支持远程查看数据的学习过程

2天前

温湿度数据可视化写的再详细也是木有人看滴~那就从简吧。记录一下今天用ESP8266接入百度智能云平台实现温湿度数据可视化的学习过程： 1.项目列表->设备型项目2.物模型->创建新的物模型->添加属性->

SELECT command - Example ABAP code to demonstrate the SELECT command

1天前

SELECT command - Example ABAP code to demonstrate the SELECT command The select command is the most fundamental function

制作自己的语义分割数据集（仿voc2012数据集）

1天前

voc数据集镜像地址数据集.文章目录新建文件夹制作索引图标签制作txt文件新建文件夹 voc数据集中我们需要的文件为ImageSets、JPEGImages、SegmentationObject，因此我们先

数据可视化大屏不仅在电脑端展示炫酷直观，在手机端展示更有意向不到的效果

1天前

最近，我在工作上开始使用迪赛智慧数，这是一款大数据可视化互动平台，它可以将各种数据报表分析的结果集成到平台的一个页面里，并将其投射到大屏上&#x

二维码生成：地推如何应用二维码并统计渠道数据？

1天前

在互联网科技飞速发展的今天，品牌传播、产品销售、活动推广…可以在线上各大社交媒体渠道以图文、视频、直播等多种方式来实现。用户也可以轻松在线了解一个产品并完成购买。但线上传播的火热和成功，并不意味着

excel下拉速度太慢_excel数据表格下拉卡顿-EXCEL表格很卡是什么原因？

1天前

我的excel文档很卡,特别是单元格下拉行动生数的时... 最简便的方法是换台性能配置高端些的电脑运行该Excel文件。如果没有高性能的电脑，就将本机上不用的程序尽量多的关闭掉之后再运算。 excel在输入文字确认时

VS Code用久了后，启动速度变慢

1天前

目录前提发现过程解决方法方法一方法二方法三前提不是因为电脑性能或者插件装太多导致的是在使用一段时间后，逐渐变慢看结论直接跳转到解决方法发现过程困扰了很久，这次一鼓作气找出问题&a

Linux下数据文件删除后文件系统空间不释放的问题解决方案

1天前

在Linux系统中，当我们删除一个文件时，通常期望该文件占用的磁盘空间会被立即释放。然而，有时候我们会遇到这样的情况：尽管文件已经被删除，但文件系统的可用空间并没有增加。这可能是由于MySQL等数据库管理系统在删除数据文件时的一些特殊处理导

Cesium: 如何将倾斜摄影数据转换为3dTiles格式

14小时前

1、引言随着Cesium平台的开源易于上手性和优秀快速开发出活原因，国内GIS平台越来越多的将Cesium作为自己产品的web端来进行使用，但面临建一个不大不小的问题：对

地理数据格式转换（geojson、kml等）

14小时前

geojson是一种对各种地理数据结构进行编码的格式，基于JavaScript对象表示法的地理空间信息数据交换格式。GeoJSON对象可以表示几何、特征或者特征集合。 kml：是一种基于XML语法

OBS录制高清视频卡顿原因之一:OBS缓存数据写入磁盘不及时

13小时前

今天在录制高清视频时,OBS总是提示编码过载. 先按百度经验中的设置方法设置: https:jingyan.baiduarticleda1091fbe2e5ce437849d6c7.html 但录屏时依然提示编码过载. 我笔记

安卓中轻量级数据存储方案分析探讨

13小时前

轻量级数据存储功能通常用于保存应用的一些常用配置信息，并不适合需要存储大量数据和频繁改变数据的场景。应用的数据保存在文件中，这些文件可以持久化地存储在设备上。需要注意的是，应

数据分析机器学习 350+ 数据集链接整理，免费下载点开就用

6小时前

结构化数据金融经济信用卡欺诈检测数据集人口普查收入数据集（UCI）银行信用卡数据集 P2P信贷平台业务数据 LendingClub贷款数据 Python商业数据分析信用卡评分模型构建数据比特币历史数据比特币

oracle删除数据文件

3小时前

alter tablespace 表空间名 drop datafile 数据文件路径;如果要删除临时文件，可以使用如下命令 alter tablespace 临时表空间名 drop tempfile 临时文件位置;也

SPM12 核磁数据预处理傻瓜攻略

2小时前

写在最前：鉴于我自己脑子傻，请不要迷信这篇文章的方法的正确性，数据分析的方法真的很多，基于数据的差异可能在一些地方的设置或数据处理步骤都会有差异&

Postgresql Linked server远程服务器取数据的执行计划原理

2小时前

本文来自postgresql官方文档 https:www.postgresqldocs11postgres-fdw.html http:postgresdocs11postgres-fdw.html 代价估计选项 po

SAS 方差分析（复习4）

2小时前

*** 单因素方差分析&多因素方差分析 （前提：满足正态假设和方差齐型） GLM（非均衡可用）：一般

移动硬盘 Windows-延缓写入失败：无法为某文件保存所有数据，数据已经丢失

1小时前

Windows延缓写入失败：Windows无法为某盘某文件保存所有数据，数据已经丢失。这个错误可能是由于您的计算机硬件或网络连接的失败导致的。提示“Windows-延缓写入失败”&#xf

u盘格式化后数据能恢复吗？这四款工具别错过！

21分钟前

作为一个经常需要处理各种数据恢复问题的数码爱好者，我经常被朋友们问到：“如果U盘数据不小心被格式化了，用哪个软件恢复最好？”今天，

电子爱好者 - 最新技术资讯及电子产品介绍！

重复测量数据多重填补 SAS code

文章目录

前言

本文主要介绍多重填补的操作步骤，对相应原理不进行介绍：

一、模拟生成数据集

1. 生成无缺失值的数据集

2.模拟存在访视缺失数据集

二、MMRM模型

1.数据库整理

2.MMRM模型分析

三、delta方法多重插补

1.数据格式转换

2.多重填补思路

(1) 判断缺失情况并进行数据填补

（2）数据分析

（3）合并结果

总结

Reference

更多相关文章

大型数据集含损坏图OSError: image file is truncated和PIL.UnidentifiedImageError: cannot identify image file解决方案

ESP8266接入百度智能云平台实现温湿度数据可视化，支持远程查看数据的学习过程

SELECT command - Example ABAP code to demonstrate the SELECT command

制作自己的语义分割数据集（仿voc2012数据集）

数据可视化大屏不仅在电脑端展示炫酷直观，在手机端展示更有意向不到的效果

二维码生成：地推如何应用二维码并统计渠道数据？

excel下拉速度太慢_excel数据表格下拉卡顿-EXCEL表格很卡是什么原因？

VS Code用久了后，启动速度变慢

Linux下数据文件删除后文件系统空间不释放的问题解决方案

Cesium: 如何将倾斜摄影数据转换为3dTiles格式

地理数据格式转换（geojson、kml等）

OBS录制高清视频卡顿原因之一:OBS缓存数据写入磁盘不及时

安卓中轻量级数据存储方案分析探讨

数据分析机器学习 350+ 数据集链接整理，免费下载点开就用

oracle删除数据文件

SPM12 核磁数据预处理 傻瓜攻略

Postgresql Linked server远程服务器取数据的执行计划原理

SAS 方差分析（复习4）

移动硬盘 Windows-延缓写入失败：无法为某文件保存所有数据，数据已经丢失

u盘格式化后数据能恢复吗？这四款工具别错过！

发表评论

推荐文章

学生党，如何充分利用云服务器？

word打开文档很久很慢_word文档打开速度慢的几个原因和解决方法

如何修改系统内核版本

用Python做小工具——精简blf文件

Win10 只有Edge无法上网的解决方法

热门文章

keepass和坚果云实现全平台密码管理

还在看游戏本电脑性价比排行2020榜单？不如直接看TA

第六章 恶意代码与防护

Win11系统突然卡顿？这些方法帮你恢复流畅

Decline：构建优雅的命令行工具

启动应用程序出现audiodg.exe找不到问题解决

自媒体批量下载短视频软件，批量下载短视频有诀窍

关于电脑DNS服务导致浏览器无法上网问题

SourcesTree使用手册3：文件贮藏与删除

MATLAB_2021详细安装教程（附安装包链接）

最新文章

三星U盘格式化后数据不见了？3个方法帮您找回珍贵文件

格式化后数据恢复全解析

华恒2410常见问题

Windows Mobile平台智能系统存储器ROM和RAM解释

移动硬盘加密

联想e480一键恢复小孔_联想自带一键恢复没用了怎么处理

如何恢复U盘里格式化数据？别慌，有带图详细步骤！

ubuntu2

转载：基于AT91RM9200与LINUX2.6.26内核的嵌入式平台开发全过程

ArchLinux 2009.08 硬盘安装

开机直接进入键盘布局_开机怎么进入安全模式（windows10停留选择键盘布局）

u盘格式化后数据能恢复吗？这四款工具别错过！

u盘快速格式化后怎么恢复文件：深入解析与全面指南

授之以鱼不如授之以渔！五分钟教会您手工查杀***！

|--------硬件故障专题--------| 主板.CPU.硬盘.内存.显卡.声卡

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

`本文主要介绍多重填补的操作步骤，对相应原理不进行介绍：`

SPM12 核磁数据预处理傻瓜攻略

第六章恶意代码与防护

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载