“RTextTools”create_matrix 出现错误

Posted

技术标签:

【中文标题】“RTextTools”create_matrix 出现错误【英文标题】:"RTextTools" create_matrix got an error 【发布时间】:2015-12-07 10:15:24 【问题描述】:

我正在运行 RTextTools 包来构建文本分类模型。

当我准备预测数据集并尝试将其转换为矩阵时。我得到错误:

Error in if (attr(weighting, "Acronym") == "tf-idf") weight <- 1e-09 : 
  argument is of length zero

我的代码如下:

table<-read.csv("traintest.csv",header = TRUE)
dtMatrix <- create_matrix(table["COMMENTS"])
container <- create_container(dtMatrix, 
                              table$LIKELIHOOD_TO_RECOMMEND, 
                              trainSize=1:5000,testSize=5001:10000, 
                              virgin=FALSE)
model <- train_model(container, "SVM", kernel="linear", cost=1)

predictionData<-read.csv("rest.csv",header = TRUE)
**predMatrix <- create_matrix(predictionData["COMMENTS"],originalMatrix=dtMatrix)**
Error in if (attr(weighting, "Acronym") == "tf-idf") weight <- 1e-09 : 
      argument is of length zero

最后一个代码给出了错误(粗体) 我尝试在谷歌上搜索,但没有找到一个明确的解决方案。

谢谢

【问题讨论】:

构建要测试的项目的常用方法是使用head。一旦有了可重现的示例,首选方法是使用dput 提供明确的示例。 感谢您的回答,如果您的意思是我只能用head(几个样本)进行测试,那么如何使用构建的模型对剩余数据进行分类?谢谢 我试图提示您做的是发布足够的信息,我们可以提供帮助。仅仅发布一条没有数据的错误消息几乎是不够的。您需要自己进行测试或提供示例以支持进一步调查。 【参考方案1】:

运行这个:

trace("create_matrix",edit=T)

在弹出的源代码框中,第 42 行会出现“acronym”这个词的拼写错误。将“A”更改为“a”并点击“保存” - 之后应该可以正常工作。

【讨论】:

@Chris 从github 安装版本。

以上是关于“RTextTools”create_matrix 出现错误的主要内容,如果未能解决你的问题,请参考以下文章

情感分析-R与spark机器学习库测试分类比较

R 无法打开连接

C - 位矩阵的位域

局部变量可能指向释放的内存

我们应该在训练/测试拆分之前还是之后预处理文本数据? [关闭]