tdm <- tm::DocumentTermMatrix(myCorpus)
tdm.tfidf <- tm::weightTfIdf(tdm)
tdm.tfidf <- tm::removeSparseTerms(tdm.tfidf, sparse= 0.999)
tfidf.matrix <- as.matrix(tdm.tfidf)
install.packages("proxy")
# Cosine distance matrix (useful for specific clustering algorithms)
dist.matrix = proxy::dist(tfidf.matrix, method = "cosine"
Мой код зависает на строке tfidf.matrix <- as.matrix(tdm.tfidf)
и вызывает сбой R. Не знаю почему
Насколько велик ваш корпус? Сколько у вас оперативной памяти?
Это говорит о больших элементах SimpleCorpus 35912