Как правильно импортировать столбцы из файла json и назначить его переменной фрейма данных pandas? Когда я сохраняю кадр данных pandas в переменную «твит», он имеет «дата» в качестве заголовка для двух столбцов, и даты не отсортированы должным образом.
С другой стороны, «ретвиты» имеют правильный заголовок «дата, число tweet_counts» и сортировку по дате. Что мешает мне свести их вместе.
import pandas as pd
import matplotlib.pyplot as plt
import twint
c = twint.Config()
c.Search = "#womensmarch OR rights"
c.Since = "2016-11-01"
c.Until = "2017-01-01"
c.Hide_output = True
c.Store_json = True
c.Pandas = True
c.Output = "womensmarch_2016.json"
twint.run.Search(c)
df = pd.read_json("womensmarch_2016.json", lines=True)
tweet = df["date"].value_counts()
df["tweet_counts"] = df["retweets_count"] + 1
retweets = df.groupby(df["date"]).sum()["tweet_counts"]
fig, ax = plt.subplots()
ax.plot(tweet, label="tweet")
ax.plot(retweets, label="retweets")
ax.legend()
plt.show()