Есть ли способ указать конкретные данные в фрейме данных в категории, например «технология» для заголовка новостей?

avatar
dimitris1821gr
8 августа 2021 в 22:40
36
0
0

Я работал над проектом по анализу данных с использованием Python, где я первоначально создал гистограммы для визуализации анализа тональности указанных заголовков, например, насколько субъективным или объективным является заголовок или является ли его сообщение положительным, нейтральным и т. д. Теперь я хотите создать диаграмму, которая классифицирует заголовки в соответствии с темой, о которой они говорят, например, если заголовок говорит о стоимости определенной валюты, категорией для него могут быть «финансы». Я довольно долго искал что-то, что могло бы делать то, что я хочу, но так и не нашел ничего похожего.

Для анализа тональности, который я уже сделал, я использовал TextBlob, но я не уверен, что он может делать то, что я хочу.

Заранее спасибо.

Источник
Darren Cook
9 августа 2021 в 06:28
0

Существует закрытое голосование за «причину сообщества», но они не сказали, что это такое. Но я думаю, что вопрос нужно разделить, поскольку вы спрашиваете как об анализе текста для определения категории, так и о создании диаграммы этих данных. Поскольку похоже, что вы уже знаете, как сделать диаграмму, я бы отказался от этого и тега matplotlib? И вместо этого добавьте тег text-classification. (И, конечно же, поиск существующих вопросов по этому тегу.)

Ответы (0)