教程专区 ·

如何在自己电脑构建鉴黄系统!GitHub大佬供计算机学习鉴黄功能的图片数据库

 

  • porn – 色情图片
  • hentai – 无尽的图像,但也包括色情图纸
  • sexy – 色情图片,但不是色情内容。想想裸体照片,花花公子,比基尼,沙滩排球等。
  • neutral – 安全的工作中性图像的日常事物和人
  • drawings – 安全的工作图纸(包括动漫)

以下是每个脚本(位于scripts目录下)的作用:

  • 1_get_urls.sh- 在scripts/source_urls下载上述5个类别中的每个类别的图像URL 下,遍历文本文件。该Ripme应用程序执行所有繁重的任务。源URL主要是指向各种subreddits的链接,但可以是Ripme支持的任何网站。 注意:我已经为您运行了此脚本,其输出位于raw_data目录中。除非您编辑文件,否则无需重新运行scripts/source_urls
  • 2_download_from_urls.sh- 下载raw_data目录中文本文件中找到的URL的实际图像
  • 3_optional_download_drawings.sh- (可选)脚本,从Danbooru2018数据库下载SFW动画图像
  • 4_optional_download_neutral.sh- (可选)脚本,从Caltech256数据集下载SFW中性图像
  • 5_create_train.sh-创建data/train目录,并将所有*.jpg与*.jpeg文件到它raw_data。还会删除损坏的图像
  • 6_create_test.sh-创建data/test目录和移动N=2000从随机文件为每个类data/train到data/test(如果你需要一个不同的火车/测试分裂改剧本里面这个数)。或者,您可以多次运行它,每次它都会将N每个类的图像从中移动data/train到data/test。

想要构建一套鉴黄系统,必须有大量的真实图片供计算机进行学习,以便于区分开正常图片和黄色图片。

近期有位加拿大程序员在Github上传了图片列表,里面包含了大量图片地址可以供计算机进行学习。

图片分为几类,正常图,性感图,色情图等,在项目主页有具体的部署和使用方法。

点击

各文件夹下的txt就是图片文件列表。

内容投诉