Turbofan引擎退化数据集(CMAPSSData)简介

Turbofan 引擎退化数据集简介

数据驱动的预测面临着长期的挑战,即缺乏从运行到故障的数据集。在大多数情况下,现实世界中的数据包含不断增长的故障的特征,但在故障真实发生之前,没有或只有很少的数据捕获故障的发生过程。因为获取实际的系统故障过程数据通常耗时较长且成本非常高昂,所以在大多数情况下,生产系统都没有适当的工具来收集相关数据。幸运的是,有些人在持续收集类似数据,并出于竞争等原因将数据集发布了出来,但是仍然只有很少的数据集被公布出来。数据集少带来的害处是阻碍了数据预测领域的发展。
NASA为举办以PHM为主题的比赛,发布了CMAPSSData数据集。这个数据集仅为使用历史数据(包含从运行到故障)来作为预测设备剩余寿命(RUL),而无需考虑底层的物理因素。
CMAPSSData数据来源于Turbofan引擎,Turbofan引擎是一种现代的汽油涡轮引擎,NASA空间探索局用的就是这种引擎。
数据集包括每个引擎的时间序列。所有的引擎都是同一类型,但在制造过程中,每个引擎的初期的磨损程度和差异是不同的,这一点用户是不知道的。有三种可选的配置,可用于改变每个引擎的性能。每个引擎有 21 个传感器,当引擎运行时,传感器收集与引擎状态相关的测量数据。收集到的数据中有一些传感器噪声。
逐渐地,每个引擎会有一些不足,这些可以从传感器读数中发现。时间序列在发生故障前的某个时间结束。数据包括引擎单元号、时间戳、三种配置以及 21 个传感器读取的数据。

数据集文件内容如下: 000.png 训练数据集内容如下: 001.png 其中第2列是时间序列,第3-5列代表三种配置,后面21列代表传感器数据003.jpg