第一步:准备图片
首先我们需要准备好用于训练和验证的图片,图片的分辨率可以随意,因为pytorch有resize的功能,可以把图片缩放到任意你想要的大小。图片支持类型:.JPG,.PNG…(反正常用的一般都支持)
详细参考官网:
https://pillow.readthedocs.io/en/5.1.x/handbook/image-file-formats.html
第二步:图片分类
我们需要创建一个文件夹(最好是和代码文件在同级目录下,虽然我没有这样做哈哈),你可以取名为test啊什么的,反正随意啦。接着我们要在这个文件夹下再创建两个文件夹,分别命名为train和valid,存放训练数据和验证数据,哈哈别急还没完。我们还需要在这两个文件夹下创建n个文件夹(禁止套娃!),文件夹的个数取决你的分类的类别,有多少类就要创建多少个文件夹,一个文件夹对应一个类。你也可以看下面的导图。创建完后就可以把你准备好的图片按照对应的文件夹进行存放啦
文件夹分类导图
第三步:图片导入
完整代码:
1 | #常用头文件 |
注:
- 如果你的代码文件和你的数据集在同一文件夹下,那么引用的时候就可以不用全路径,如:
1 | train = ImageFolder('/tempu/train/',simple_transform) |
- simple_transform是你需要应用的数据变换和增强
- shuffle=True:训练时随机抽取样本
- drop_last=True:当你的数据集不能被定义的batch_size整除时,多余的部分会被丢掉。
- num_workers=0 启用多线程个数,一般设置成0是不会有任何问题的。启用多线程可以加快数据集读取速度,但是很多时候需要自己调试,有些IDE并不支持。
money money money~ money money~
- 本文链接:http://yoursite.com/2020/07/24/DL_P2/
- 版权声明:本博客所有文章除特别声明外,均默认采用 许可协议。
若没有本文 Issue,您可以使用 Comment 模版新建。
GitHub Issues