NLP内容质量识别

Posted AI算法攻城狮

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了NLP内容质量识别相关的知识,希望对你有一定的参考价值。

一、标题低质

图文格式混乱或不美观,音画质量差等影响阅读体验。包含但不限于以下场景:

  • 图文低质的内容,包含但不限于以下场景:
    • 排版混乱:文章乱码、无段落或无标点;
    • 语意不明:病句或错别字较多、乱码符号,有碍于读者理解内容;
    • 逻辑混乱:内容拼凑或重复,前后内容没有衔接,无关内容占比较大;
  • 音画低质的内容,包括但不限于以下场景:
    • 视频缩放画面:视频中角标/logo/字幕被剪切,导致显示不全,或画面中人物面部被部分剪切;
    • 视频添加边框:视频添加边框且占比较大,或水印遮挡画面严重,无法识别视频主体;
    • 视频添加滤镜:画面带有严重滤镜至色彩失真,或人物明显发白、发红,呈现不正常色调;
    • 视频画面倾斜:画面整体被侧置或倒置,字幕、logo、左右等特征为镜像翻转,或画面被非正常拉长或挤压变形。

二、封面/配图低质

封面或配图内容质量差,与文章主体无关且不能为文章增补信息量。包含但不限于以下场景:

  • 图片与内容毫无关联,且图片质量差的;
  • 图文明显不相关,带不良图片蹭流量的,图片类型包含但不限于如下:
    • 有不良诱导倾向的图片;
    • 偷拍类图片;
    • 男女亲密同框,易引发低俗、恶俗等不良想象图片等。

以上是关于NLP内容质量识别的主要内容,如果未能解决你的问题,请参考以下文章

NLP内容质量识别

NLP 实战 | 团队开发,一些本质的问题

NLP 实战 | 团队开发,一些本质的问题

知识图谱命名实体识别(NLP)

NLP不良信息识别

NLP不良信息识别