Вопросы, помеченные тегом «pandas»

Pandas - это библиотека Python для обработки и анализа данных, например фреймы данных, многомерные временные ряды и перекрестные наборы данных, которые обычно встречаются в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек науки о данных в Python.
avatar
hallque
15 декабря 2021 в 20:06
504
3

Выигрыш в столбце с NaN не меняет максимальное значение

Обратите внимание, что аналогичный вопрос был задан некоторое время назад, но на него так и не ответили (см. Выигрыш не изменяет максимальное значение). Я пытаюсь winsorize столбца в кадре данных, используя winsorize из scipy.stats.mstats. Если в столбце нет значений...
avatar
azowad
9 августа 2021 в 06:48
184
1

Изменить имя столбца в таблице html, созданной с помощью панд

Я создал кадр данных panda из моделей django. Была создана таблица. Я хочу переименовать имена столбцов, которые находятся в теге th. Как мне это сделать? Вот что пришло. Изображение находится по ссылке. https://ibb.co/s1VxRF2 @login_required def...
avatar
Jerem Moses
9 августа 2021 в 06:24
132
1

Как просмотреть полные данные при использовании Dataframe в pandas при использовании ноутбука Jupyter? [дубликат]

вместо представления ....(точка-точка) при открытии фрейма данных, как получить доступ или просмотреть все значения в блокноте Jupyter. эталонное изображение
avatar
user3556757
9 августа 2021 в 06:19
87
0

Имя серии кортежей вызывает InvalidIndexError в Pandas 1.2.4, но не в 0.25.3

Эта игрушка воспроизводит проблему: import pandas as pd print(f"pandas: {pd.__version__}") !python --version #artificial 2 qf = pd.Series(index = pd.to_datetime(['12Dec2020', '13Dec2020','14Dec2020', '15Dec2020','16Dec2020']), data=...
avatar
Engr Ali
9 августа 2021 в 06:14
101
1

как разбить несколько списков в столбце и создать новый фрейм данных и карту для определенного значения в python?

Я работаю с фреймом данных, содержащим несколько столбцов. Один из столбцов с несколькими списками, например: [[[0.0, 0.0, 1024.0, 1024.0], [0.0, 0.0, 1024.0, 1024.0], [0.0, 0.0, 1024.0, 1024.0], [0.0, 0.0, 1024.0, 1024.0]], ['Effusion', 'Emphysema', 'Infiltration',...
avatar
Slartibartfast
9 августа 2021 в 06:11
73
1

Получение значения индекса даты в пандах с несколькими индексами

У меня есть следующий кадр данных: a = df['Low'].groupby(['week']).min() week 1 1699 2 1721 3 1741 4 1809 ... 28 2592 29 2570 30 2696 31 2683 53 1735 Name: Low, dtype: int32 Чтобы получить дату, я использую эту...
avatar
Mojiz Mehdi
9 августа 2021 в 06:07
96
2

Необходимо выполнить расчет в кадре данных с предыдущим значением строки

У меня есть этот фрейм данных с двумя столбцами. Условие, которое мне нужно сформировать, это когда столбец «Созданный баланс» пуст, мне нужно взять последнее заполненное значение «Созданный баланс» и добавить его со следующей строкой значения «Сумма». Исходный кадр...
avatar
kavm
9 августа 2021 в 06:06
92
1

Сортировка кадра данных pandas, где значения являются датой (как создать сводную_таблицу без агрегации)

У меня есть фрейм данных со столбцами A, B, C и Date. Меня не волнует C. Я хочу создать сводную таблицу, в которой у меня есть A в первом столбце, затем B, а затем в третьем столбце я хочу иметь даты. Я получаю сообщение об ошибке DataError: Нет числовых типов для...
avatar
ek11222
9 августа 2021 в 05:59
92
2

Pandas/Python – создать новый столбец на основе перекрестной ссылки из другого столбца

У меня есть набор данных с информацией о сотрудниках. В этом наборе данных соответствующими полями являются столбец EmployeeName, столбец ID и столбец SupervisorName. Я хочу создать новый столбец с именем SupervisorID, который дает нам идентификатор руководителя...
avatar
Kelvin Lo
9 августа 2021 в 05:51
88
1

Панды находят определенную строку из индекса строки и возвращают значение в новый столбец

Я создаю новый столбец на основе данных о том, проводил ли учащийся повторный тест по предмету на основе столбца "файл": Это данные строки: Вот как я хочу добиться: Это мой код: import pandas as pd df = pd.DataFrame(columns=['file', 'class', 'student', 'subject',...
avatar
srikar
9 августа 2021 в 05:02
84
1

я пытаюсь использовать набор данных с помощью pandas в ibm cloud error=кодек 'utf-8' не может декодировать байты в позиции 135-136: недопустимый байт продолжения

Это код, автоматически сгенерированный ibm cloud, когда я загружаю свой набор данных и пытаюсь кодировать='latin-1', но все равно выдает ошибку import os, types import pandas as pd from botocore.client import Config import ibm_boto3 def __iter__(self): return 0 if...
avatar
SQL Learner 1
9 августа 2021 в 05:01
98
2

Преобразование объекта в плавающий в кадре данных с помощью панд

Используемые данные: https://drive.google.com/file/d/1nU1wCZFpp-0_qoom3L1GhhGI6obX5GhB/view?usp=sharing Я пытаюсь сделать столбец world_rank числом с плавающей запятой. Я использовал следующий код для других столбцов, который изменил код, но когда я пытаюсь сделать это...
avatar
Lynn
9 августа 2021 в 04:59
86
1

множественная кумулятивная сумма на основе сгруппированных столбцов

У меня есть набор данных, в котором я хотел бы суммировать два столбца, а затем выполнить вычитание, отображая кумулятивную сумму Данные id date t1 t2 total start cur_t1 cur_t2 final_o finaldb de_t1 de_t2 a q122 4 1 5 50 25 20 ...
avatar
odebear
9 августа 2021 в 04:08
289
1

'>=' не поддерживается между экземплярами 'str' и 'int' в функциях и использованием лямбда в приложении

Я пытаюсь определить функцию, а затем применить ее к фрейму данных, называемому обзорами. def stars(country, points): if country == 'Canada': return 3 elif points >= 95: return 3 elif points >= 85: return 2 else: ...
avatar
Wenhao Cui
9 августа 2021 в 03:48
178
0

Как ускорить код с помощью concat из-за PerformanceWarning: DataFrame сильно фрагментирован. Обычно это результат вызова `frame.insert`

Предупреждение: PerformanceWarning: DataFrame сильно фрагментирован. Обычно это результат многократного вызова frame.insert, который имеет плохую производительность. Вместо этого рассмотрите возможность использования pd.concat. Чтобы получить дефрагментированный кадр,...
avatar
Coel Locandro
9 августа 2021 в 02:57
298
2

Pandas groupby преобразует максимальное решение?

Контекст: Столбцы моего фрейма данных: идентификаторы (с дубликатами) в A, значения времени B и строковые значения C Мне нужно обновить все значения C, где C соответствует самому последнему времени B для каждого идентификатора A. Показывает последнее время для...
avatar
user10525916
9 августа 2021 в 02:56
92
1

Как сопоставить данные из одного фрейма данных в столбец в другом фрейме данных?

У меня есть два отдельных фрейма данных, представляющих разные типы данных, основанных на времени. Один содержит сотни тысяч временных меток, разбросанных по нескольким месяцам. Этот кадр данных имеет столбцы, представляющие месяц года, время суток и измеренную...
avatar
asif rahman
9 августа 2021 в 02:52
98
0

Код Python для фильтрации с использованием нескольких меток столбцов с использованием функции определения

Я использую таблицу данных с несколькими столбцами. Здесь нужно создать простой код Python, используя функцию определения, чтобы отфильтровать разные столбцы, указав метки данных. Я считаю, что код должен быть примерно в этом формате, но не стесняйтесь вносить...
avatar
Lynn
9 августа 2021 в 02:34
100
1

Создайте промежуточный итог с несколькими столбцами в Python

У меня есть набор данных, в котором я хотел бы суммировать несколько столбцов, а затем создать несколько столбцов с промежуточным итогом. Вывод должен быть сгруппирован по идентификатору и дате. Данные id date t1 t2 total start curr_t2 curr_t2 a q1 22 4 ...
avatar
user58653
9 августа 2021 в 02:33
87
1

Заполните пропущенные значения категориального столбца

Я пытаюсь заполнить некоторые отсутствующие категориальные значения столбца. У меня 2 колонки. Один категоричен, а другой нет. Если в категориальном столбце отсутствует значение, я хочу присвоить ему значение на основе категориального значения с наибольшим количеством...