Вопросы, помеченные тегом «dataframe»
Фрейм данных - это двухмерная табличная структура данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные, и могут быть разных типов (в отличие от массива или матрицы). Хотя термин «фрейм данных» или «фрейм данных» используется для этой концепции на нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), термин «таблица» используется в MATLAB и SQL.
15 декабря 2021 в 20:06
347
3
Выигрыш в столбце с NaN не меняет максимальное значение
Обратите внимание, что аналогичный вопрос был задан некоторое время назад, но на него так и не ответили (см. Выигрыш не изменяет максимальное значение).
Я пытаюсь winsorize столбца в кадре данных, используя winsorize из scipy.stats.mstats. Если в столбце нет значений...
9 августа 2021 в 06:48
137
1
Изменить имя столбца в таблице html, созданной с помощью панд
Я создал кадр данных panda из моделей django. Была создана таблица. Я хочу переименовать имена столбцов, которые находятся в теге th. Как мне это сделать? Вот что пришло. Изображение находится по ссылке.
https://ibb.co/s1VxRF2
@login_required
def...
9 августа 2021 в 06:42
52
1
Разбить столбец словарей на новые столбцы
В моем кадре данных есть столбец словарей:
ID
имя
значение
статистика
{'среднее': 154,0, 'медианное': 154,0, 'стандартное': 0,0}
{'среднее': 131,19, 'медианное': 93,68, 'стандартное': 53,04}
Мне нужно разбить этот столбец на новые...
9 августа 2021 в 06:14
54
1
как разбить несколько списков в столбце и создать новый фрейм данных и карту для определенного значения в python?
Я работаю с фреймом данных, содержащим несколько столбцов. Один из столбцов с несколькими списками, например: [[[0.0, 0.0, 1024.0, 1024.0], [0.0, 0.0, 1024.0, 1024.0], [0.0, 0.0, 1024.0, 1024.0], [0.0, 0.0, 1024.0, 1024.0]], ['Effusion', 'Emphysema', 'Infiltration',...
9 августа 2021 в 06:07
51
2
Необходимо выполнить расчет в кадре данных с предыдущим значением строки
У меня есть этот фрейм данных с двумя столбцами. Условие, которое мне нужно сформировать, это когда столбец «Созданный баланс» пуст, мне нужно взять последнее заполненное значение «Созданный баланс» и добавить его со следующей строкой значения «Сумма».
Исходный кадр...
9 августа 2021 в 05:56
77
1
Как объединить список в кадре данных в искре
У меня есть такой код
columns = ("language","users_count","status")
data = (("Java",None,"1"), ("Python", "100000","2"), ("Scala", "3000","3"))
rdd = spark.sparkContext.parallelize(data)
df = rdd.toDF(columns)
df.withColumn('concat', regexp_replace(concat(...
9 августа 2021 в 04:09
67
2
Преобразовать проценты в числовые во фрейме данных в R? [дубликат]
Привет и спасибо, что читаете меня
Я пытаюсь преобразовать столбцы df в числовые значения, но это не работает, кто-нибудь знает, почему?
Код следующий:
datos <- data.frame(dato1 = c(1,2,3),
porcentaje = c("1%", "2%", "3%")
...
9 августа 2021 в 03:10
36
1
Сравнение столбцов в одной группе
Мой фрейм данных:
data <- structure(list(group = c(1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L), col1 = c(9,
9.05, 7.15, 7.21, 7.34, 8.12, 7.5, 7.84, 7.8, 7.52, 8.84, 6.98,
6.1, 6.89, 6.5, 7.5, 7.8, 5.5, 6.61, 7.65, 7.68),...
9 августа 2021 в 02:57
254
2
Pandas groupby преобразует максимальное решение?
Контекст:
Столбцы моего фрейма данных: идентификаторы (с дубликатами) в A, значения времени B и строковые значения C
Мне нужно обновить все значения C, где C соответствует самому последнему времени B для каждого идентификатора A.
Показывает последнее время для...
9 августа 2021 в 02:56
49
1
Как сопоставить данные из одного фрейма данных в столбец в другом фрейме данных?
У меня есть два отдельных фрейма данных, представляющих разные типы данных, основанных на времени. Один содержит сотни тысяч временных меток, разбросанных по нескольким месяцам. Этот кадр данных имеет столбцы, представляющие месяц года, время суток и измеренную...
8 августа 2021 в 23:30
403
2
Превращение словаря с одним ключом и несколькими значениями в кадр данных pandas
Как превратить этот словарь в фрейм данных pandas?
dict = {'key1':['value1','value2'], 'key2':['value1','value2', 'value3'], 'key3':['value1','value2', 'value3', 'value4'] }
Я пробовал оба варианта:
pd.Dataframe(dict) и pd.DataFrame.from_dict(dict)
но я получаю ту же...
8 августа 2021 в 23:23
461
0
Сохранение нескольких фреймов данных pandas в SQLite за одну транзакцию
Я работаю над приложением, которое работает с несколькими десятками фреймов данных pandas в памяти, и я использую SQLite в качестве формата файла приложения. В настоящее время я сохраняю каждый DataFrame следующим образом:
import pandas as pd
import sqlite3
df1 =...
8 августа 2021 в 23:17
31
1
Код ошибки при выборе значений в столбце моего DataFrame: «ValueError: длины должны совпадать для сравнения»
У меня есть столбец с именем «Состояния» со всеми 50 состояниями в качестве значений, и я пытаюсь получить определенные состояния для настройки в другом фрейме данных по регионам. Однако, когда я делаю это и запускаю новый DataFrame, я получаю ошибку значения...
8 августа 2021 в 23:10
142
1
Оценка сходства для фильтрации столбцов данных в пандах
У меня есть кадр данных pandas, df со следующими именами столбцов
columns = ['Baillie Gifford Positive Change Fund B Accumulation',
'Stewart Investors Worldwide Select Fund Class B (accumulation) Gbp',
'Stewart Investors Worldwide Select Fund Class A (accumulation)...
8 августа 2021 в 21:59
93
1
Очистка столбца Pandas для определенного типа данных
Я пытаюсь очистить некоторые столбцы и столкнулся с некоторыми проблемами.
Существует множество данных о продажах с двоичными значениями для каждого продукта.
Прилагается образец набора данных.
Сначала процесс был направлен на dropna. Кроме того, есть значения...
8 августа 2021 в 21:47
71
0
значения и столбцы разделены знаком "/"
Я имел дело с необработанным набором данных, и когда я посмотрел на него из приложения чисел Mac, он показался мне нормальным.
Однако когда я сделал read_csv() в R, я столкнулся с ошибкой. проблема в том, что все столбцы отображаются как один столбец, и это касается и...
8 августа 2021 в 20:56
76
3
Как свести столбцы фрейма данных Pandas в индекс самого внутреннего уровня без использования df.iterrows()?
Исходный файл .csv -
#,Name,Type 1,Type 2,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation,Legendary
1,Bulbasaur,Grass,Poison,45,49,49,65,65,45,1,FALSE
2,Ivysaur,Grass,Poison,60,62,63,80,80,60,1,FALSE
3,Venusaur,Grass,Poison,80,82,83,100,100,80,1,FALSE
Мой код...
8 августа 2021 в 20:46
60
2
Как удалить строки, если два условия репликации имеют ноль?
У меня есть такие данные, как два условия (условие 1, условие 2) и каждое условие с шестью повторениями. Я хотел бы отказаться, если три из двух реплик условия 1 имеют ноль в строке (выборка/строка).
gene_name con1_1 con1_2 con1_3 con2_1 con2_2 con2_3
YLZC_aa4043...
8 августа 2021 в 20:21
92
1
Ответ API в виде списка для Pandas DataFrame
У меня возникли проблемы с пониманием того, как анализировать значения из ответа API в виде списка для фрейма данных.
Ответ API 'games' представляет собой список, но он очень похож на JSON. В других примерах мне удалось создать файл dict. Этот список имеет несколько...
8 августа 2021 в 20:09
65
1
Преобразование или изменение значений столбцов на основе значений других столбцов
У меня есть кадр данных, содержащий 5 столбцов. Что я хотел бы сделать, так это изменить последние 4 столбца на первый столбец.
В основном, если значение первого столбца ниже определенного порога, следующие столбцы изменяются, а если это значение выше порога,...