У меня есть кадр данных, в котором есть несколько строк с отсутствующими данными, но есть строки, которые заполнены и совпадают с теми, в которых отсутствуют данные. Я хотел бы, чтобы мой фрейм данных имел только полный идентификатор, но не исключал тех, у которых нет никакой информации. Например, среди этих одинаковых ID какие содержат больше информации с учетом TYPE.
Ввод:
ID TYPE HEIGHT KG
-----------------------------
MEXU DOL NaN 40
RFGT DOL 140 47
RFGT DOL NaN NaN
RFGT RET 90 NaN
OJKU NaN NaN NaN
TYED NaN NaN 80
TYED NaN 100 80
TYED DOL 100 80
PJLO RET NaN NaN
PJLO DOL NaN NaN
BUAR NaN NaN NaN
Должен ли я использовать какой-то groupby
или agg
в пандах?
Ожидаемый результат:
ID TYPE HEIGHT KG
-----------------------------
MEXU DOL NaN 40
RFGT DOL 140 47
RFGT RET 90 NaN
OJKU NaN NaN NaN
TYED DOL 100 80
PJLO RET NaN NaN
PJLO DOL NaN NaN
BUAR NaN NaN NaN
Условия? Что вы устали до сих пор? В чем проблема для вас? Что вы обнаружили, изучая свою проблему? Добавьте все, что в вопросе!
Разве это не просто
df.groupby('ID', as_index=False).first()
?Вы просите других сделать работу за вас, не показывая никаких собственных попыток.