Я ищу способ найти связь между словами в таблице (или списке). В каждой ячейке таблицы у меня есть несколько слов, разделенных ";".
скажем, у меня есть таблица, как показано ниже; некоторые слова "af" или "aa" принадлежат одной ячейке.
df<-read.table(text="
A B C D
af;aa;az bf;bb c;cc df;dd
aa;az bf;bc c dc;dd
ah;al;aa bb c;cd dd
af;aa bf cc dd",header=T,stringsAsFactors = F)
Я хочу найти ассоциации между всеми словами во всем наборе данных, между ячейками (не интересуюсь ассоциациями внутри ячеек). например, сколько раз aa
и dd
появляются в одной строке, или покажите мне, какие слова имеют наибольшую связь (например, aa с bb, aa с dd,....).
ожидаемый вывод: (числа могут быть неточными, и представитель ассоциации не отображается с помощью '--')
2 pairs association (numbers can be counts, probability or normalized association)
association number of associations
aa--dd 3
aa--c 3
bb--dd 2
...
3 pairs association
aa--bb--dd 3
aa--bb--c 3
...
4 pairs association
aa--bb--c--dd 2
aa--bf--c--dd 2
...
Можете ли вы помочь мне реализовать это в R? Тх
@akrun Я обновил вопрос и ожидаемый результат. Тх