Вопросы, помеченные тегом «pandas»
Pandas - это библиотека Python для обработки и анализа данных, например фреймы данных, многомерные временные ряды и перекрестные наборы данных, которые обычно встречаются в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек науки о данных в Python.
15 декабря 2021 в 20:06
347
3
Выигрыш в столбце с NaN не меняет максимальное значение
Обратите внимание, что аналогичный вопрос был задан некоторое время назад, но на него так и не ответили (см. Выигрыш не изменяет максимальное значение).
Я пытаюсь winsorize столбца в кадре данных, используя winsorize из scipy.stats.mstats. Если в столбце нет значений...
9 августа 2021 в 06:48
137
1
Изменить имя столбца в таблице html, созданной с помощью панд
Я создал кадр данных panda из моделей django. Была создана таблица. Я хочу переименовать имена столбцов, которые находятся в теге th. Как мне это сделать? Вот что пришло. Изображение находится по ссылке.
https://ibb.co/s1VxRF2
@login_required
def...
9 августа 2021 в 06:24
91
1
Как просмотреть полные данные при использовании Dataframe в pandas при использовании ноутбука Jupyter? [дубликат]
вместо представления ....(точка-точка) при открытии фрейма данных, как получить доступ или просмотреть все значения в блокноте Jupyter. эталонное изображение
9 августа 2021 в 06:19
47
0
Имя серии кортежей вызывает InvalidIndexError в Pandas 1.2.4, но не в 0.25.3
Эта игрушка воспроизводит проблему:
import pandas as pd
print(f"pandas: {pd.__version__}")
!python --version
#artificial 2
qf = pd.Series(index = pd.to_datetime(['12Dec2020', '13Dec2020','14Dec2020', '15Dec2020','16Dec2020']),
data=...
9 августа 2021 в 06:14
54
1
как разбить несколько списков в столбце и создать новый фрейм данных и карту для определенного значения в python?
Я работаю с фреймом данных, содержащим несколько столбцов. Один из столбцов с несколькими списками, например: [[[0.0, 0.0, 1024.0, 1024.0], [0.0, 0.0, 1024.0, 1024.0], [0.0, 0.0, 1024.0, 1024.0], [0.0, 0.0, 1024.0, 1024.0]], ['Effusion', 'Emphysema', 'Infiltration',...
9 августа 2021 в 06:11
32
1
Получение значения индекса даты в пандах с несколькими индексами
У меня есть следующий кадр данных:
a = df['Low'].groupby(['week']).min()
week
1 1699
2 1721
3 1741
4 1809
...
28 2592
29 2570
30 2696
31 2683
53 1735
Name: Low, dtype: int32
Чтобы получить дату, я использую эту...
9 августа 2021 в 06:07
51
2
Необходимо выполнить расчет в кадре данных с предыдущим значением строки
У меня есть этот фрейм данных с двумя столбцами. Условие, которое мне нужно сформировать, это когда столбец «Созданный баланс» пуст, мне нужно взять последнее заполненное значение «Созданный баланс» и добавить его со следующей строкой значения «Сумма».
Исходный кадр...
9 августа 2021 в 06:06
52
1
Сортировка кадра данных pandas, где значения являются датой (как создать сводную_таблицу без агрегации)
У меня есть фрейм данных со столбцами A, B, C и Date. Меня не волнует C. Я хочу создать сводную таблицу, в которой у меня есть A в первом столбце, затем B, а затем в третьем столбце я хочу иметь даты.
Я получаю сообщение об ошибке
DataError: Нет числовых типов для...
9 августа 2021 в 05:59
50
2
Pandas/Python – создать новый столбец на основе перекрестной ссылки из другого столбца
У меня есть набор данных с информацией о сотрудниках. В этом наборе данных соответствующими полями являются столбец EmployeeName, столбец ID и столбец SupervisorName. Я хочу создать новый столбец с именем SupervisorID, который дает нам идентификатор руководителя...
9 августа 2021 в 05:51
51
1
Панды находят определенную строку из индекса строки и возвращают значение в новый столбец
Я создаю новый столбец на основе данных о том, проводил ли учащийся повторный тест по предмету на основе столбца "файл":
Это данные строки:
Вот как я хочу добиться:
Это мой код:
import pandas as pd
df = pd.DataFrame(columns=['file', 'class', 'student', 'subject',...
9 августа 2021 в 05:02
71
1
я пытаюсь использовать набор данных с помощью pandas в ibm cloud error=кодек 'utf-8' не может декодировать байты в позиции 135-136: недопустимый байт продолжения
Это код, автоматически сгенерированный ibm cloud, когда я загружаю свой набор данных и пытаюсь кодировать='latin-1', но все равно выдает ошибку
import os, types
import pandas as pd
from botocore.client import Config
import ibm_boto3
def __iter__(self): return 0
if...
9 августа 2021 в 05:01
53
2
Преобразование объекта в плавающий в кадре данных с помощью панд
Используемые данные: https://drive.google.com/file/d/1nU1wCZFpp-0_qoom3L1GhhGI6obX5GhB/view?usp=sharing
Я пытаюсь сделать столбец world_rank числом с плавающей запятой. Я использовал следующий код для других столбцов, который изменил код, но когда я пытаюсь сделать это...
9 августа 2021 в 04:59
42
1
множественная кумулятивная сумма на основе сгруппированных столбцов
У меня есть набор данных, в котором я хотел бы суммировать два столбца, а затем выполнить вычитание, отображая кумулятивную сумму
Данные
id date t1 t2 total start cur_t1 cur_t2 final_o finaldb de_t1 de_t2
a q122 4 1 5 50 25 20 ...
9 августа 2021 в 04:08
248
1
'>=' не поддерживается между экземплярами 'str' и 'int' в функциях и использованием лямбда в приложении
Я пытаюсь определить функцию, а затем применить ее к фрейму данных, называемому обзорами.
def stars(country, points):
if country == 'Canada':
return 3
elif points >= 95:
return 3
elif points >= 85:
return 2
else:
...
9 августа 2021 в 03:48
138
0
Как ускорить код с помощью concat из-за PerformanceWarning: DataFrame сильно фрагментирован. Обычно это результат вызова `frame.insert`
Предупреждение: PerformanceWarning: DataFrame сильно фрагментирован. Обычно это результат многократного вызова frame.insert,
который имеет плохую производительность. Вместо этого рассмотрите возможность использования pd.concat. Чтобы получить дефрагментированный кадр,...
9 августа 2021 в 02:57
254
2
Pandas groupby преобразует максимальное решение?
Контекст:
Столбцы моего фрейма данных: идентификаторы (с дубликатами) в A, значения времени B и строковые значения C
Мне нужно обновить все значения C, где C соответствует самому последнему времени B для каждого идентификатора A.
Показывает последнее время для...
9 августа 2021 в 02:56
49
1
Как сопоставить данные из одного фрейма данных в столбец в другом фрейме данных?
У меня есть два отдельных фрейма данных, представляющих разные типы данных, основанных на времени. Один содержит сотни тысяч временных меток, разбросанных по нескольким месяцам. Этот кадр данных имеет столбцы, представляющие месяц года, время суток и измеренную...
9 августа 2021 в 02:52
60
0
Код Python для фильтрации с использованием нескольких меток столбцов с использованием функции определения
Я использую таблицу данных с несколькими столбцами. Здесь нужно создать простой код Python, используя функцию определения, чтобы отфильтровать разные столбцы, указав метки данных.
Я считаю, что код должен быть примерно в этом формате, но не стесняйтесь вносить...
9 августа 2021 в 02:34
58
1
Создайте промежуточный итог с несколькими столбцами в Python
У меня есть набор данных, в котором я хотел бы суммировать несколько столбцов, а затем создать несколько столбцов с промежуточным итогом. Вывод должен быть сгруппирован по идентификатору и дате.
Данные
id date t1 t2 total start curr_t2 curr_t2
a q1 22 4 ...
9 августа 2021 в 02:33
49
1
Заполните пропущенные значения категориального столбца
Я пытаюсь заполнить некоторые отсутствующие категориальные значения столбца. У меня 2 колонки. Один категоричен, а другой нет. Если в категориальном столбце отсутствует значение, я хочу присвоить ему значение на основе категориального значения с наибольшим количеством...