Как подготовить данные временных рядов для ML

avatar
Adler Müller
8 августа 2021 в 20:16
22
0
0

Я хочу различать две машины на основе их временных рядов. Для этого доступны данные временного ряда, состоящие из нескольких датчиков.

Ввод выглядит следующим образом:

Номер столбца Временная метка идентификатор времени Датчик А Датчик B Идентификатор машины Ярлык
1 0 мин 0 сек 0 2,16 3,16 А 0
2 0 мин 1 сек 0 2,17 3,17 А 0
3 А 0
4 0 мин 59 с 0 2,18 3,18 А 0
5 1 мин 0 с 1 1,8 3.1 А 0
6 1 мин 59 с 1 1,9 3.1 А 0
7 2 мин 0 с 2 2.1 3.2 А 0
8 2 мин 59 с 2 2.2 3.2 А 0
9
10 0 мин 0 сек 0 2,3 3,6 В 1
11 0 мин 1 сек 0 2.2 NaN В 1
12 В 1
13 0 мин 59 с 0 NaN 3,5 В 1
14 1 мин 0 с 1 2,4 3,5 В 1
15 1 мин 59 с 1 2,3 3,5 В 1
16 2 мин 0 с 2 2,3 3,7 В 1
17 2 мин 59 с 2 2,4 3,7 В 1

Для каждой машины записывается 3 минуты данных. ( На самом деле, это гораздо больше, чем 3 минуты, здесь просто для простоты)

Я хотел бы получить 3 "примера" из записанного временного ряда для каждой машины. Поэтому я создал столбец идентификатора времени. Я хотел бы объединить все данные одного и того же идентификатора времени и сделать их доступными позже, например. машина опорных векторов. Я не уверен, как подготовить строки и столбцы, например. идентификатор времени 0. Поэтому я не знаю, как должен выглядеть правильный формат.

Могу ли я подготовить данные следующим образом? Или как насчет основной процедуры здесь

идентификатор времени Датчик A_0s Датчик B_0s Датчик A_1s Датчик B_1s Датчик A_59s Датчик B_59s Идентификатор машины Ярлык
0 2,16 3,16 2,17 3,17 2,17 3,18 А 0
1 1,8 3.1 1,9 3.1 .. .. А 0
0 2,3 3,6 2.2 NaN NaN 3,5 В 1

Целесообразно ли здесь использовать такие библиотеки, как tsfresh? или это полезно только в том случае, если события происходят в пределах временных данных?

Надеюсь, я достаточно ясно изложил вопрос. Спасибо

Источник

Ответы (0)