针对网络社区的色情头像识别过滤自动化

乌云厂商 | 2014-07-15 21:37

百万量级的头像文件,有没有什么开源的组件或者好的方法进行自动化识别,人工识别和删除成本太高了。主要是识别这一个环节,貌似没找到有什么成熟的技术。小伙伴们给出出主意呗,老样子,精华有WB以表感谢。

[原文地址]

各种吐槽:

1#

YY-2012 (SM沐足桑拿推拿来前订房优惠多多 一条龙服务) | 2014-07-15 21:39

社区?视频聊天室?

http://www.wooyun.org/bugs/wooyun-2014-068121/trace/78dd8dbec0b369b481c9cc8076cf84ad

我有个网络摄像机的没通过审核

2#

乌云厂商 | 2014-07-15 21:40

@YY-2012 一个类似Gif快手、唱吧、秒拍这样的社区

3#

YY-2012 (SM沐足桑拿推拿来前订房优惠多多 一条龙服务) | 2014-07-15 21:42

@乌云厂商 看错标题了。。

4#

0x2b (你以为谁都跟sky似的 博客被黑了都不知道) | 2014-07-15 21:49

自动识别。 怎么识别。。。。 难道要像某种绿色软件连胡某某的头像都过滤掉? 注意是肉色。。

5#

0x_Jin (世上人多心不齐) | 2014-07-15 21:52

@0x2b 你楼上那个的头像就是要过滤的首选

6#

乌云厂商 | 2014-07-15 21:53

@0x_Jin 说得对,这种头像按我们的需求是该杀的^_^

7#

乌云厂商 | 2014-07-15 21:53

@0x2b 针对颜色和点阵识别的我们考虑过,但是可行性不高

8#

0x2b (你以为谁都跟sky似的 博客被黑了都不知道) | 2014-07-15 22:11

@乌云厂商 如果是自动化就有些难办了 可以设立一个举报机制

9#

0x2b (你以为谁都跟sky似的 博客被黑了都不知道) | 2014-07-15 22:13

http://www.docin.com/p-217957219.html

http://www.docin.com/p-215693070.html

http://www.docin.com/p-747517859.html

论文太高深 没有深看

10#

Mujj (Krypt VPS特价www.80host.com) | 2014-07-15 22:18

这个和社工库一样,首先得有动作图片库。

11#

Mujj (Krypt VPS特价www.80host.com) | 2014-07-15 22:19

建议用打码平台人肉识别。

12#

乌云厂商 | 2014-07-15 22:32

@0x2b 感谢,稍后我学习学习

13#

乌云厂商 | 2014-07-15 22:32

@Mujj 打码平台是个不错的想法,我研究一下:)

14#

Annabelle | 2014-07-15 23:00

@Mujj 我觉得这库是很好的东西.

15#

Mujj (Krypt VPS特价www.80host.com) | 2014-07-15 23:15

@Annabelle http://www.cbsr.ia.ac.cn/china/Demos%20CH.asp

16#

Annabelle | 2014-07-16 01:54

@Mujj 高大上!

17#

abaddon (我就认识这几个字母因此取了这名字) | 2014-07-16 03:40

@乌云厂商

举报机制 被举报者扣除乌云币 作为举报者的奖励

不过社区是封闭的 没人来查吧 我来乌云 一个原因是有MU这样的猥琐男存在 和谐了就不好玩了

18#

abaddon (我就认识这几个字母因此取了这名字) | 2014-07-16 03:45

@乌云厂商

先制定明确的头像使用规范

首先 违规用户可以被举报不符合规范的用户 对于恶意预报的举报者 扣除一个乌云币 扣光的封号

然后 论坛管理人员核实 核实确认的 删除头像并扣除一个乌云币 扣光的直接,,,

最好 举报者得到奖励

这样可以大大增加乌云众批评和自我批评的积极性

习组长不是在研究群众路线吗

乌云也要走群众路线实践教育活动才合群

另 不要相信计算机能胜任所有的任务 那群家伙不可靠

19#

love of red moon | 2014-07-16 10:52

这个嘛,让我想起了绿坝娘。话说当时搜了一张牛的图,就把我浏览器杀了。估计是太“黄”了......

20#

啦绯哥 | 2014-07-16 11:09

其实人脸识别系统或者图像识别系统了

21#

px1624 (aaaaaaaaa) | 2014-07-16 11:16

自动识别的话,你说会不会把桃子当成色情图片了呢。。

22#

核攻击 (统治全球,奴役全人类!毁灭任何胆敢阻拦的有机生物!) | 2014-07-16 11:34

这个非常难~

23#

付弘雪 | 2014-07-16 12:18

如果出了识别系统 我敢说乌云肯定更多人 使用这种头像来挑战乌云的过滤机制。。。。各种混淆。。。。

最后 乌云这个系统的制作者 击败无数 淫荡的挑战者 获得 图灵奖............

24#

灵惜 (哇咔咔,搞定它) | 2014-07-17 14:59

Boobstagram 这个网站专做这个哟 可以研究下

25#

乌云厂商 | 2014-07-17 16:22

@0x2b 感谢大家,@Mujj 2WB 1WB, 乌云限制,今天只能这么多:)

26#

想要减肥的胖纸 | 2014-07-17 18:03

求人脸识别。我想从我的avi mp4 mov 等等文件 识别女主面部 做数据库 以后相亲 可以先查一下。

27#

Z3r0l | 2014-07-21 02:07

其实很简单 借鉴聊天转轮chatroulett 的屏蔽思路 就是新用户注册10分钟 然后弹出验证 验证方式就是在所有用户头像中找出色情头像 最后按投票比进行ID屏蔽

28#

7dscan | 2014-07-21 17:22

先找黑样本,搜集足够多以后,做图片相似度识别。

29#

二狗子 (农村非主流) | 2014-07-21 22:00

图灵奖

30#

Jasonfcku (我就是打酱油啊打酱油。。。哎呀,我艹,你打我干嘛?) | 2014-07-21 22:15

这个专门有单位在做吧,发到这里是什么意思?

留言评论(旧系统):

我觉得 @ 2014-07-18 11:28:15

我觉得只有用户举报这个办法最好,设计一个类似累积金币这样的东西,用金币换点东西啥的用户才有举报积极性

本站回复:

哈哈哈,这个方法好!人工识别!

flowind @ 2014-07-20 09:25:19

嘿嘿.. 有个亮点. 求人脸识别。我想从我的avi mp4 mov 等等文件 识别女主面部 做数据库 以后相亲 可以先查一下。 这类识别最简单的方法就是禁止上传自定义头像.没的上传了就没的这些问题了..

本站回复:

“禁止上传自定义头像”额,这个太彻底了……

佚名 @ 2014-07-20 21:52:38

直接调用搜索引擎的搜图API然后分析文本关键字,分析文字比分析图像难度低多了。请叫我雷锋。

本站回复:

我靠,好方法!太他妈的有才了!赞一个!

Z3r0l @ 2014-07-21 02:06:30

其实很简单 聊天转轮的屏蔽思路 就是新用户注册10分钟 然后弹出验证 验证方式就是在所有用户头像中找出色情头像 最后按投票比进行ID屏蔽

本站回复:

尼玛,这方法太他妈的有才了。

酒逍遥 @ 2014-07-21 15:57:17

综合前面的方法 我觉得可以分成这样几部分来处理 1、先利用搜索引擎的搜图API查找相似图片.然后分析关键字.这样可以过滤大多数比较流行的或者明显的色情图片 2、搜索引擎识别出来非色情图片的可以统一加权重值.越像色情图片的权重值越高. 3、对搜索引擎无法识别的图片或高权重的图片,利用打码平台和用户筛选的机制,找出确认为色情图片的头像咔嚓之。 4、网站后来负责人工处理打码平台和用户筛选得出的有异议的图片(例如:一部分说是色情,一部分说不是) 多管齐下,相信即使有漏网之鱼也是凤毛麟角.当然误杀率也是难免的.

本站回复:

亲提出的方案,十分完善细致,可实行度极高!赞一个!