admin管理员组

文章数量:1534893

1.UCI-HAR 数据集介绍
1.1基本背景
UCI 人类活动识别数据集是以智能手机采集的传感器数据为基础的活动识别,创建于2012年,实验团队来自意大利热那亚大学。
这些数据是从30名年龄在19岁到48岁之间的志愿者身上收集的,这些志愿者将智能手机绑在腰间,进行6项标准活动中的一项,通过开发的手机软件记录运动数据。记录的运动数据是来自智能手机(特别是三星Galaxy S II)的x、y和z加速度计数据(线性加速度)和陀螺仪数据(角速度),采样频率为 50Hz(每秒50个数据点)。每名志愿者进行两次活动序列,第一次在设备位于腰间左侧,第二次测试时,智能手机由用户自己按喜好放置。同时记录每个执行活动的志愿者的视频,后期根据这些视频和传感器数据进行手动标记所属运动类别(类似剪辑视频中的音画同步)。
执行的六项活动如下:
① Walking
②Walking Upstairs
③Walking Downstairs
④Sitting
⑤Standing
⑥ Laying
1.2数据集的shape
数据集中将训练集和测试集中的传感器数据按照一个特征一个txt的格式各分成了9个文件。7352 和 2947 是测试集和训练集中每个txt文件shape的第一个维度,表示重采样之后的样本个数。
数据集shape的第二个维度 128,在 2.56 秒的固定宽度滑动窗口中对时间信号进行采样,有 50% 的重叠。(2.56sec×50Hz = 128cycles)
第三个维度9,来自加速度计的三轴总加速度和三轴的身体重力加速度;陀螺仪的三轴角速度;

【11.29】opportunity数据集
12名受试者在这种环境下进行日常生活活动,每个受试者平均产生2小时的有效数据,总共有25小时的传感器数据。我们已经注释了72个运行中的19个。因此,这个数据集具有高度丰富的手势实例和注释。据作者所知,该数据集是迄今为止最大的多模态活动识别数据集。

1.1基本背景
数据集包括在用户进行典型日常活动时记录的运动传感器读数:
身体磨损传感器: 7个惯性测量单元,12个3d 加速度传感器,4个3d 定位信息
物体传感器: 12个具有3d 加速度和2d 转速传感器
环境传感器: 13个开关和8个3d 加速度传感器
这些数据是4个用户,每个用户6次执行。其中,5个是日常生活活动拥有属性,是日常活动的自然执行。第6次运行是一次“演练”运行,用户执行一个预设剧情的活动。
场景中用户的活动按不同的级别进运动模式分类:
与23个对象相关的13个操作的低级操作; 17个中级手势类; 以及5个高级活动类
记录场景 :
实验对象在一个房间里模拟一个单间公寓,里面有一个躺椅、一个厨房、一扇通向室外的门、一台咖啡机、一张桌子和一把椅子。通过指导用户遵循脚本,但让他们自由如何实现高级目标,我们实现了活动的自然执行。我们进一步鼓励他们尽可能自然地表演他们习惯的所有变化。对于每一个实验对象,我们记录了6次不同的测试。其中五个,称为日常生活活动(ADL) ,遵循一个给定的情况详细如下。另一个是演练,用于生成大量的活动实例。
(1)日常活动
ADL 活动包括时间展开的情况,在每种情况下(例如准备三明治) ,都会出现大量的动作原语(例如拿面包、移动到面包切割机、操作面包切割机)。日常生活能力测试运行日常生活能力测试运行包括临时展开的情况:
开始: 躺在躺椅上,起床
Groom: 在房间里移动,检查所有的物品是否在抽屉和架子上的正确位置
放松: 出去在建筑物周围散步
准备咖啡: 用咖啡机准备一杯加牛奶和糖的咖啡
喝咖啡: 饮咖啡,
准备三明治: 包括面包、奶酪和意大利腊肠,使用面包切割机和各种刀具和盘子吃三明治
清理:把原来用过的东西放到原来的地方或洗碗机上,清理餐桌
休息:躺在躺椅上
(2)演练活动
17个类别
训练过程包括20次重复以下活动顺序:
打开然后关上冰箱
打开然后关上洗碗机
打开然后关上3个抽屉(在不同的高度)
打开然后关门1打开然后关门2
开关灯然后关闭
清洁桌子
站着喝水
坐着喝水
1.2集中式模型时数据集的shape
5373和619是测试集和训练集中每个txt文件shape的第一个维度,表示重采样之后的样本个数。
数据集shape的第二个维度64 [固定宽度滑动窗口中对时间信号进行采样,有 50% 的重叠。(2.56sec×50Hz = 128cycles)]
或者是40 固定滑窗大小为40,在这种情况下训练集batch为26372
第三个维度113,为什么是来自7个惯性测量单元+12×3d 加速度传感器+4×3d 定位信息
+物体传感器: 12×3d 加速度+12×2d 转速传感器
+环境传感器: 13×开关和8×3d 加速度传感器

【2.24】WSIDM
从29名用户进行行走、慢跑、爬楼梯时收集标记加速度计数据,如行走、慢跑、爬楼梯、坐和站立,

【2.9】USC-HAD数据集
1.1基本背景
USC-HAD 中定义了 12 种不同的行为。数据集共包含 14 个人的行为数据,每个人每种行为进行 5 次试验,每次试验时长约 24 秒,试验中搜集安置在测试人腰间的一种叫 MotionNode 仪器的三轴加速度计与三轴陀螺仪读数,传感器采样频率 100Hz。
12项基本活动:

活动描述
向前走被试者沿着一条直线向前走
向左走受试者沿着逆时针方向走了一圈
向右走受试者按顺时针方向走了一圈
上楼被试者多次向上走楼梯
下楼被试者多次向下走楼梯
向前跑受试者以一条直线向前跑
跳过受试者保持在相同的位置,并不断地上下跳跃
受试者坐在椅子上工作或休息。坐立不安也被认为属于这个类。
被试者站在那里,和某人说话
被试者睡觉或躺在床上
上电梯受试者乘坐一部上行电梯
下电梯被试者乘坐一个下降的电梯

1.2数据集的sahpe

【2.10】HHAR(Heterogeneity Human Activity Recognition)数据集
1.1背景介绍
智能手机和智能手表传感器的人类活动识别异质数据集由两个数据集组成,用于研究传感器异质性对人类活动识别算法(分类、自动数据分割、传感器融合、特征提取等)的影响。
这个数据集包含了智能手机上常见的两个运动传感器的读数(acc和gyro)。当用户带着智能手表和智能手机按照特定顺序执行活动时,阅读会被记录下来。
9个用户
活动内容: 骑单车、坐、站、走、上楼及下楼。六个动作
传感器: :两个嵌入式传感器,即加速度传感器和陀螺仪,以各自设备允许的最高频率采样。
设备: 4块智能手表(2块 LG 手表,2块三星 Galaxy Gears)
8部智能手机(2部 Samsung Galaxy S III mini,2部 Samsung Galaxy S III,2部 LG Nexus 4,2部三星 Galaxy s +)

【3.7】PAMAP2
PAMAP2 Physical Activity Monitoring数据集包含18种不同的身体活动(如步行、骑车、踢足球等)的数据,由9名受试者佩戴3个惯性测量单元和一个心率监测器执行。该数据集可用于活动识别和强度估计,同时开发和应用数据处理、分割、特征提取和分类的算法。
传感器 3 Colibri无线惯性测量单元(IMU): -采样频率:100Hz -传感器位置:- 1 IMU的手腕上的优势手臂- 1 IMU的胸部- 1 IMU的优势侧的脚踝
HR-monitor: -采样频率:~9Hz
数据收集方案每个受试者必须遵循包含12个不同活动的方案。
文件夹Protocol按主题包含这些录音。
此外,一些受试者还进行了一些可选的活动。文件夹Optional按主题包含这些录音。
数据文件原始的感官数据可以在空格分隔的文本文件(.dat)中找到,每个主题每个会话1个数据文件(协议或可选)。缺失的值用NaN表示。数据文件中的一行对应于一个有时间戳和标记的感觉数据实例。数据文件包含54列:每行包含一个时间戳、一个活动标签(基本事实)和52个原始感知数据属性。
属性信息:
数据文件中54列的组织方式如下
1.时间戳(s) 2.activityID(参见下面到活动的映射)
3.心率(bpm) 4-20 IMU的手。
21-37胸部 38-54.IMU踝关节

IMU的感官数据包括:
1.温度(Â C)
2-4.3d -加速度数据(ms-2),比例:Â 16g,分辨率:13位
5-7.3d加速数据(ms-2),比例:Â 6g,分辨率:13位
8-10.三维陀螺仪数据(rad/s)
11-13.三维磁强计数据(Î T)
14-17.定向(在此数据收集中无效)

activityid和相应活动列表:
1躺 2坐 3站 4步行 5运行 6骑自行车 7北欧行走 9 看电视
10计算机工作 11汽车 12升楼梯 13下行楼梯 16用真空吸尘器打扫
17 熨烫 18叠衣服 19打扫屋子 20踢足球 24跳绳 0其他(瞬变活动)
【3.8】Unimb-SHAR

新的加速度样本数据集,使用安卓智能手机设计用于人类活动识别和跌倒检测。
该数据集包括11,771个样本,包括30名年龄从18岁到60岁的受试者进行的人类活动和跌倒。
样本被分为17个细粒度类,并分为两个粗粒度类:一种包含9种日常生活活动类型(ADL)类型的样本,另一种包含8种跌倒类型的样本。
此数据集由30个实验对象产生的17类数据组成。这17类数据由8类ADL数据和7个“跌倒”动作数据组成。该数据集无空数据(NULL),并且尽管有三类数据占比较高(行走、跑步、下行),但其中的各类数据在总体上是均匀分布的
关于分类任务,主要发现可以总结如下:
(i)无论选择的分类器和特征向量如何,都很容易区分跌倒和adl。.事实上,这些类型的活动呈现出完全不同的加速度形状,从而简化了识别任务;
(ii)平均而言,无论分类器和选择的特征向量如何,区分跌倒类型比区分活动类型更困难。这是由于不同类型的瀑布的加速度形状之间的相似性。相反,adl加速度形状存在差异。最后,评估表明,无论在训练和测试数据集都存在同一主题的样本,无论使用的特征向量,都提高了分类器的性能。这是因为每个人类受试者在执行活动上都与其他受试者不同,即使她与他们具有相同的身体特征。

本文标签: 数据HAR