MySQL 查询以检查某些短语(重复文章、抄袭)

Posted

技术标签:

【中文标题】MySQL 查询以检查某些短语(重复文章、抄袭)【英文标题】:MySQL query to check for certain phrases (duplicate article, plagiarism) 【发布时间】:2010-10-11 17:05:59 【问题描述】:

有没有办法在 mysql 中检查多个短语?

我需要检查一篇文章是否有重复的版本存储在 mysql 中。

这是算法 我首先创建了一个需要检查的句子数组(删除所有非字母数字字符) 然后构建查询(如何?) 得到结果后,我比较是否有 50% 的句子是重复的,而不是我认为这篇文章是重复的。 表中的文章与已删除的非字母数字字符一起存储。 示例:

iamdevelopingatooltocheckduplicatearticlesstoredinmysqldatabasehoweveriveencountered 

有什么建议吗?

【问题讨论】:

【参考方案1】:

是的,请查看“编程集体智能”以了解这些算法。它们与分组有关。

【讨论】:

以上是关于MySQL 查询以检查某些短语(重复文章、抄袭)的主要内容,如果未能解决你的问题,请参考以下文章

JQuery Validator Method 检查某些短语

有没有啥软件可以查作文的重复率,就是一篇文章写出来和网上比对有没有抄袭的

用 Mysql 实现一个全文检索系统

C - 计数元素(绑定检查) - 数组 [重复]

sql 查询以检查电子邮件中的重复项

mongodb:查询以检查数组中的项目是不是包含特定字符串[重复]