用Python做了鉴黄模型,内含多20万张“不可描述”图片
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用Python做了鉴黄模型,内含多20万张“不可描述”图片相关的知识,希望对你有一定的参考价值。
GitHub出现一个名为“NSFW Model”的项目。通俗一点来说,就是一个鉴黄模型。这个模型,使用的数据来自前不久量子位介绍的那个数据集,内含多20万张“不可描述”图片。
同时,这个模型也被项目的贡献者做成了Demo。
既然有了Demo,那肯定是免不了测试一番……
Demo效果
Demo网站十分简单,进去之后能做什么一目了然。
上传图片之后,是自动给出结果,不需要点击其他按钮。但有时候不会给出结果…..还有待完善。
学习过程中有不懂的可以加入我们的学习交流秋秋圈784中间758后面214,与你分享Python企业当下人才需求及怎么从零基础学习Python,和学习什么内容。相关学习视频资料、开发工具都有分享
结果是数据集中提到的5种类别的可能性。分别是:hentai、sexy、neutral、drawings、porn。具体每个类别代表的意思,如下图所示:
好了,开始第一个测试:
这个图有71%的可能性是hentai;16%的可能性是porn。你觉得准吗?
再来一个:
71%的可能性是sexy。
但下面这个,就有点不好说了。
porn到了76%,19%是hentai。按照这个标准,《超体》别想正常上映了……
但整体上,这个模型还是能工作的,比如整个漫画,就很好的识别出来了,比如其他的一些,也能识别出来(但图片就不好放了)。
至于准确率怎么样,没法给出定论。如果你有兴趣,可以去体验下这个Demo。地址:
话说话来,看到这个模型,你有没有想自己上手体验一下?GitHub有相关的开源代码。
请收好项目地址:
https://github.com/rockyzhengwu/nsfw
最后,数据集地址:
https://github.com/alexkimxyz/nsfw_data_scrapper
One More Thing
以上是关于用Python做了鉴黄模型,内含多20万张“不可描述”图片的主要内容,如果未能解决你的问题,请参考以下文章
python NSFW Model 图片识别鉴黄 后面更新视频检测
聊天没有表情包被嘲讽,程序员直接用python爬取了十万张表情包
Python3 - Docker部署caffe open_nsfw 图片鉴黄