MySQL 查询以检查某些短语(重复文章、抄袭)
Posted
技术标签:
【中文标题】MySQL 查询以检查某些短语(重复文章、抄袭)【英文标题】:MySQL query to check for certain phrases (duplicate article, plagiarism) 【发布时间】:2010-10-11 17:05:59 【问题描述】:有没有办法在 mysql 中检查多个短语?
我需要检查一篇文章是否有重复的版本存储在 mysql 中。
这是算法 我首先创建了一个需要检查的句子数组(删除所有非字母数字字符) 然后构建查询(如何?) 得到结果后,我比较是否有 50% 的句子是重复的,而不是我认为这篇文章是重复的。 表中的文章与已删除的非字母数字字符一起存储。 示例:
iamdevelopingatooltocheckduplicatearticlesstoredinmysqldatabasehoweveriveencountered
有什么建议吗?
【问题讨论】:
【参考方案1】:是的,请查看“编程集体智能”以了解这些算法。它们与分组有关。
【讨论】:
以上是关于MySQL 查询以检查某些短语(重复文章、抄袭)的主要内容,如果未能解决你的问题,请参考以下文章
JQuery Validator Method 检查某些短语