Вопросы, помеченные тегом «dataframe»

Фрейм данных - это двухмерная табличная структура данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные, и могут быть разных типов (в отличие от массива или матрицы). Хотя термин «фрейм данных» или «фрейм данных» используется для этой концепции на нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), термин «таблица» используется в MATLAB и SQL.
avatar
hallque
15 декабря 2021 в 20:06
347
3

Выигрыш в столбце с NaN не меняет максимальное значение

Обратите внимание, что аналогичный вопрос был задан некоторое время назад, но на него так и не ответили (см. Выигрыш не изменяет максимальное значение). Я пытаюсь winsorize столбца в кадре данных, используя winsorize из scipy.stats.mstats. Если в столбце нет значений...
avatar
azowad
9 августа 2021 в 06:48
137
1

Изменить имя столбца в таблице html, созданной с помощью панд

Я создал кадр данных panda из моделей django. Была создана таблица. Я хочу переименовать имена столбцов, которые находятся в теге th. Как мне это сделать? Вот что пришло. Изображение находится по ссылке. https://ibb.co/s1VxRF2 @login_required def...
avatar
Birish
9 августа 2021 в 06:42
52
1

Разбить столбец словарей на новые столбцы

В моем кадре данных есть столбец словарей: ID имя значение статистика {'среднее': 154,0, 'медианное': 154,0, 'стандартное': 0,0} {'среднее': 131,19, 'медианное': 93,68, 'стандартное': 53,04} Мне нужно разбить этот столбец на новые...
avatar
Engr Ali
9 августа 2021 в 06:14
54
1

как разбить несколько списков в столбце и создать новый фрейм данных и карту для определенного значения в python?

Я работаю с фреймом данных, содержащим несколько столбцов. Один из столбцов с несколькими списками, например: [[[0.0, 0.0, 1024.0, 1024.0], [0.0, 0.0, 1024.0, 1024.0], [0.0, 0.0, 1024.0, 1024.0], [0.0, 0.0, 1024.0, 1024.0]], ['Effusion', 'Emphysema', 'Infiltration',...
avatar
Mojiz Mehdi
9 августа 2021 в 06:07
51
2

Необходимо выполнить расчет в кадре данных с предыдущим значением строки

У меня есть этот фрейм данных с двумя столбцами. Условие, которое мне нужно сформировать, это когда столбец «Созданный баланс» пуст, мне нужно взять последнее заполненное значение «Созданный баланс» и добавить его со следующей строкой значения «Сумма». Исходный кадр...
avatar
Cobe9696
9 августа 2021 в 05:56
77
1

Как объединить список в кадре данных в искре

У меня есть такой код columns = ("language","users_count","status") data = (("Java",None,"1"), ("Python", "100000","2"), ("Scala", "3000","3")) rdd = spark.sparkContext.parallelize(data) df = rdd.toDF(columns) df.withColumn('concat', regexp_replace(concat(...
avatar
Jorge Hernández
9 августа 2021 в 04:09
67
2

Преобразовать проценты в числовые во фрейме данных в R? [дубликат]

Привет и спасибо, что читаете меня Я пытаюсь преобразовать столбцы df в числовые значения, но это не работает, кто-нибудь знает, почему? Код следующий: datos <- data.frame(dato1 = c(1,2,3), porcentaje = c("1%", "2%", "3%") ...
avatar
GOGA GOGA
9 августа 2021 в 03:10
36
1

Сравнение столбцов в одной группе

Мой фрейм данных: data <- structure(list(group = c(1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L), col1 = c(9, 9.05, 7.15, 7.21, 7.34, 8.12, 7.5, 7.84, 7.8, 7.52, 8.84, 6.98, 6.1, 6.89, 6.5, 7.5, 7.8, 5.5, 6.61, 7.65, 7.68),...
avatar
Coel Locandro
9 августа 2021 в 02:57
254
2

Pandas groupby преобразует максимальное решение?

Контекст: Столбцы моего фрейма данных: идентификаторы (с дубликатами) в A, значения времени B и строковые значения C Мне нужно обновить все значения C, где C соответствует самому последнему времени B для каждого идентификатора A. Показывает последнее время для...
avatar
user10525916
9 августа 2021 в 02:56
49
1

Как сопоставить данные из одного фрейма данных в столбец в другом фрейме данных?

У меня есть два отдельных фрейма данных, представляющих разные типы данных, основанных на времени. Один содержит сотни тысяч временных меток, разбросанных по нескольким месяцам. Этот кадр данных имеет столбцы, представляющие месяц года, время суток и измеренную...
avatar
msh855
8 августа 2021 в 23:30
403
2

Превращение словаря с одним ключом и несколькими значениями в кадр данных pandas

Как превратить этот словарь в фрейм данных pandas? dict = {'key1':['value1','value2'], 'key2':['value1','value2', 'value3'], 'key3':['value1','value2', 'value3', 'value4'] } Я пробовал оба варианта: pd.Dataframe(dict) и pd.DataFrame.from_dict(dict) но я получаю ту же...
avatar
Connor Ferster
8 августа 2021 в 23:23
461
0

Сохранение нескольких фреймов данных pandas в SQLite за одну транзакцию

Я работаю над приложением, которое работает с несколькими десятками фреймов данных pandas в памяти, и я использую SQLite в качестве формата файла приложения. В настоящее время я сохраняю каждый DataFrame следующим образом: import pandas as pd import sqlite3 df1 =...
avatar
Matthew Villarreal
8 августа 2021 в 23:17
31
1

Код ошибки при выборе значений в столбце моего DataFrame: «ValueError: длины должны совпадать для сравнения»

У меня есть столбец с именем «Состояния» со всеми 50 состояниями в качестве значений, и я пытаюсь получить определенные состояния для настройки в другом фрейме данных по регионам. Однако, когда я делаю это и запускаю новый DataFrame, я получаю ошибку значения...
avatar
msh855
8 августа 2021 в 23:10
142
1

Оценка сходства для фильтрации столбцов данных в пандах

У меня есть кадр данных pandas, df со следующими именами столбцов columns = ['Baillie Gifford Positive Change Fund B Accumulation', 'Stewart Investors Worldwide Select Fund Class B (accumulation) Gbp', 'Stewart Investors Worldwide Select Fund Class A (accumulation)...
avatar
jpu
8 августа 2021 в 21:59
93
1

Очистка столбца Pandas для определенного типа данных

Я пытаюсь очистить некоторые столбцы и столкнулся с некоторыми проблемами. Существует множество данных о продажах с двоичными значениями для каждого продукта. Прилагается образец набора данных. Сначала процесс был направлен на dropna. Кроме того, есть значения...
avatar
Ahmet Atilla Colak
8 августа 2021 в 21:47
71
0

значения и столбцы разделены знаком "/"

Я имел дело с необработанным набором данных, и когда я посмотрел на него из приложения чисел Mac, он показался мне нормальным. Однако когда я сделал read_csv() в R, я столкнулся с ошибкой. проблема в том, что все столбцы отображаются как один столбец, и это касается и...
avatar
Sherman Chen
8 августа 2021 в 20:56
76
3

Как свести столбцы фрейма данных Pandas в индекс самого внутреннего уровня без использования df.iterrows()?

Исходный файл .csv - #,Name,Type 1,Type 2,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation,Legendary 1,Bulbasaur,Grass,Poison,45,49,49,65,65,45,1,FALSE 2,Ivysaur,Grass,Poison,60,62,63,80,80,60,1,FALSE 3,Venusaur,Grass,Poison,80,82,83,100,100,80,1,FALSE Мой код...
avatar
PraveenKumar
8 августа 2021 в 20:46
60
2

Как удалить строки, если два условия репликации имеют ноль?

У меня есть такие данные, как два условия (условие 1, условие 2) и каждое условие с шестью повторениями. Я хотел бы отказаться, если три из двух реплик условия 1 имеют ноль в строке (выборка/строка). gene_name con1_1 con1_2 con1_3 con2_1 con2_2 con2_3 YLZC_aa4043...
avatar
Tim R
8 августа 2021 в 20:21
92
1

Ответ API в виде списка для Pandas DataFrame

У меня возникли проблемы с пониманием того, как анализировать значения из ответа API в виде списка для фрейма данных. Ответ API 'games' представляет собой список, но он очень похож на JSON. В других примерах мне удалось создать файл dict. Этот список имеет несколько...
avatar
Marc
8 августа 2021 в 20:09
65
1

Преобразование или изменение значений столбцов на основе значений других столбцов

У меня есть кадр данных, содержащий 5 столбцов. Что я хотел бы сделать, так это изменить последние 4 столбца на первый столбец. В основном, если значение первого столбца ниже определенного порога, следующие столбцы изменяются, а если это значение выше порога,...