爬取GitHub上用于深度学习的“不可描述”图片数据集

冲冲冲

手冲战士在行动

刚打完CSGO(白给)后在刷GitHub时偶然看到

NSFW Data Scrapper

“用于训练图像分类器的数据集”

点进去仔细一看数据分类

  • porn
  • hentai
  • sexy
  • neutral
  • drawings

再点进去仔细一看,txt格式文件里约加起来约230000个URL

Changce

今天我就要让GitHub变成我的PornHub

看了看说明文档

只支持Linux,但是正所谓“折腾才是乐趣”

想用练练python

于是写了个Windows版本的


Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×