11.CNN实现真实猫狗图片分类-程序员宅基地

技术标签: 深度学习  神经网络  

CNN实现真实猫狗图片分类

个人认为,和上一节的mnist数据集里面的手写数字图片不同之处就是,真实的图片更加复杂,像素点更多。因此在对应的图片预处理方面会稍微麻烦一些。但是这个例子能让我们可以处理自己遇到的问题,不仅限于已有的mnist。

不多说直接上代码

import keras
from keras import layers
import numpy as np
import os
import shutil

这一步主要是为了制作一个Keras 能够识别处理,直接读取的图片数据集
文件结构为。 一个train 和test文件夹, 在train和test文件夹下 建立 猫和狗的文件夹,并把图片放入对应文件夹。 (在解决自己的问题的时候,也是要这样放好图片)

base_dir = '/.dataset/cat_dog'
train_dir = os.path.join(base_dir, 'train')
train_dir_dog = os.path.join(train_dir, 'dog')
train_dir_cat = os.path.join(train_dir, 'cat')

test_dir = os.path.join(base_dir, 'test')
test_dir_dog = os.path.join(test_dir, 'dog')
test_dir_cat = os.path.join(test_dir, 'cat')

os.mkdir(base_dir)
os.mkdir(train_dir)
os.mkdir(train_dir_dog)
os.mkdir(train_dir_cat)
os.mkdir(test_dir)
os.mkdir(test_dir_dog)
os.mkdir(test_dir_cat)
dc_dir='./dataset'   #存图片的位置

猫的1000张训练图片

fnames = ['cat'.{
    }.jpg.format(i) for i in rangen (1000)]  #文件名称 因为图片的命名是 cat1.jpg cat10.gpj形式
for fname in fnames:
    s = os.path.join(dc_dir,fname)  #源地址
    d = os.path.join(train_dir_cat, fname) #目标地址
    shutil.copyfile(s,d)

猫的500张测试图片

fnames = ['cat'.{
    }.jpg.format(i) for i in rangen (1000,1500)]  #文件名称
for fname in fnames:
    s = os.path.join(dc_dir,fname)  #源地址
    d = os.path.join(test_dir_cat, fname) #目标地址
    shutil.copyfile(s,d)

狗也是同样操作

fnames = ['dog'.{
    }.jpg.format(i) for i in rangen (1000)]  #文件名称
for fname in fnames:
    s = os.path.join(dc_dir,fname)  #源地址
    d = os.path.join(train_dir_dog, fname) #目标地址
    shutil.copyfile(s,d)
    
fnames = ['cat'.{
    }.jpg.format(i) for i in rangen (1000,1500)]  #文件名称
for fname in fnames:
    s = os.path.join(dc_dir,fname)  #源地址
    d = os.path.join(test_dir_dog, fname) #目标地址
    shutil.copyfile(s,d)
    

数据集处理好了,现在来想想处理图片的步骤。

步骤:
(1)读取图片
(2)将图片解码
(3)预处理图片(图片裁剪–整理成同样大小)
(4)图片归一化

那么就按照以上步骤对图片进行操作。
这里用一个keras 的图片生成器

from keras.preprocessing.image import ImageDataGenerator     #迭代读取图片

对图片作归一化(因为神经网络就喜欢归一化后的数据)很简单,就是除以255就可以了

train_datagen = ImageDataGenerator(rescale=1./255)    #建立图片生成器,并作归一化
test_datagen = ImageDataGenerator(rescale=1./255)

生成想要的图片规格 这里是将图片变成200*200规格

train_generator = train_datagen.flow_from_firectory(train_dir,
                                                    target_size=(200,200),
                                                   batch_size=20,
                                                   calss_mode='binary') 
#参数是(图片目录,裁剪的大小,batch_size,二分类(分猫和狗))

test_generator = test_datagen.flow_from_firectory(test_dir,
                                                    target_size=(200,200),
                                                   batch_size=20,
                                                   calss_mode='binary') 

数据集生成后,现在开始建立CNN模型,很简单和以前建立的一样,区别在于,由于是真实图片,比上一节的手写图片要复杂的多,所以建立很多层来学习

model = keras.Sequential()
model.add(layers.Conv2D(64,(3*3),activation='relu',input_shape=(200,200,3)))
model.add(layers.Conv2D(64,(3*3),activation='relu'))
model.add(layers.MaxPooling2D())
model.add(layers.Dropout(0.25))

model.add(layers.Conv2D(64,(3*3),activation='relu',input_shape=(200,200,3)))
model.add(layers.Conv2D(64,(3*3),activation='relu'))
model.add(layers.MaxPooling2D())
model.add(layers.Dropout(0.25))

model.add(layers.Conv2D(64,(3*3),activation='relu',input_shape=(200,200,3)))
model.add(layers.Conv2D(64,(3*3),activation='relu'))
model.add(layers.MaxPooling2D())
model.add(layers.Dropout(0.25))

model.add(layers.Flatten())
model.add(layers.Dense(256,activation='relu'))
model.add(layers.Dropout(0.5))

model.add(layers.Dense(1,activation='sigmoid'))
model.compile(optimizer='adam',   #用实际数据的时候,可能需要调参,那么就实例化 optimizer=keras.optimizers.Adam(lr=0.0001)
              loss='binary_crossentropy'
              metrics=['acc']
             )

下面是训练模型,跟常规的有一点点不一样

history = model.fit_generator(
    train_generator,
     epochs=30,
    steps_per_epoch=100,
    validation_data=test_generator,
    validation_steps=50
    )

#注意,此处与以前的模型训练有所不同, 必须要告诉程序 一个epoch 要训练多少张图片,
#例如 现在训练集是2000张 batch_size=20 所以steps_per_epoch=100 ,训练集有1000张,所以validation_steps=50 

以上就建立一个用于真实图片的识别的CNN卷积神经网络啦。
ps:另外真实数在自己电脑上算起来很慢(除非你有GPU可能要快点),所以免费GPU www.kaggle.com 香啊

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/Thames_h/article/details/110622792

智能推荐

我的一个关于文件的程序 - [C语言]_fseek(fp,0l,2)-程序员宅基地

文章浏览阅读6.3k次。 2005-09-05我的一个关于文件的程序 - [C语言]#includevoid main(){char ch;FILE* fp;if((fp=fopen("test.txt","r"))==NULL){printf("error");exit(1);}fseek(fp,0L,2);while((fseek(fp,-1L,1))!=-1){ch=fgetc(fp);pu_fseek(fp,0l,2)

oracle 设置查询条数,SQL、MySQL、Oracle、 Sqlite、Informix数据库查询指定条数数据的方法...-程序员宅基地

文章浏览阅读674次。SQL查询前10条的方法为:select top X * from table_name--查询前X条记录,可以改成需要的数字,比如前10条。select top X * from table_name order by colum_name desc--按colum_name属性降序排序查询前X条记录,“order by” 后紧跟要排序的属性列名,其中desc表示降序,asc表示升序(默认也..._oracle怎么用语句设置查询结果数量

课程设计之第二次冲刺----第九天-程序员宅基地

文章浏览阅读58次。讨论成员:罗凯旋、罗林杰、吴伟锋、黎文衷讨论完善APP,调试功能。转载于:https://www.cnblogs.com/383237360q/p/5011594.html

favicon.ico 图标及时更新问题_win 软件开发 ico图标多久更新-程序员宅基地

文章浏览阅读5.4k次。首先看你 favicon.ico 图标文件引入路径是否正确然后 看ico文件能否正常打开,这两个没问题的话,在地址栏直接输入你的域名 http://xxx.com/favicon.ico 注意 此刻可能还是 之前的ico图标 不要着急 刷新一下 试试 完美解决 清除程序缓存_win 软件开发 ico图标多久更新

手工物理删除Oracle归档日志RMAN备份报错_rman 说明与资料档案库中在任何归档日志都不匹配-程序员宅基地

文章浏览阅读2.1k次。Oracle归档日志删除我们都都知道在controlfile中记录着每一个archivelog的相关信息,当然们在OS下把这些物理文件delete掉后,在我们的controlfile中仍然记录着这些archivelog的信息,在oracle的OEM管理器中有可视化的日志展现出,当我们手工清除 archive目录下的文件后,这些记录并没有被我们从controlfile中清除掉,也就是or_rman 说明与资料档案库中在任何归档日志都不匹配

命令提示符_命令提示符文件开头-程序员宅基地

文章浏览阅读706次。命令提示符:[ root@localhost桌面] #[用户名@主机名 当前所在位置] #(超级用户) KaTeX parse error: Expected 'EOF', got '#' at position 25: …用户: #̲ su 用户名 //切… su密码:[ root@cml桌面] #临时提升为root权限:# sudo 命令..._命令提示符文件开头

随便推点

android+打包+不同app,基于Gradle的Android应用打包实践-程序员宅基地

文章浏览阅读152次。0x01 基本项目结构使用Android Studio创建的Android项目会划分成三个层级:project : settings.gradle定义了构建应用时包含了哪些模块;build.gradle定义了适用于项目中所有模块的构建配置module : 可以是一个app类型的module,对应生成apk应用;也可以是一个lib类型的module,对应生成aar包. 每个module中包含的bui..._android多个应用 gradle 怎么打包指定的应用

qsort实现顺序与逆序/排整型,字符串数组,字符数组,结构体类型数组的名字排序,年龄排序等_qsort反向排序-程序员宅基地

文章浏览阅读599次,点赞12次,收藏11次。前言:通常我们排序都需要创建一个函数实现排序,但当我们排完整型数组时,想要排字符串呢?那需要重新创建一个函数,完善它的功能,进而实现排字符串,这样非常繁琐,但是有一个函数可以帮我们实现传什么,排什么;qsort的传参:(1️⃣,2️⃣,3️⃣,4️⃣) (首元素地址,排序的元素个数,每个元素的大小,指向比较两个元素的函数的指针)1️⃣2️⃣3️⃣4️⃣的传参方法,下面介绍:…整型数组:......_qsort反向排序

MVC绕过登陆界面验证时HttpContext.Current.User.Identity.Name取值为空问题解决方法_mvc 不验证登陆-程序员宅基地

文章浏览阅读355次。MVC绕过登陆界面验证时HttpContext.Current.User.Identity.Name取值为空问题解决方法_mvc 不验证登陆

Java中DO、DTO、BO、AO、VO、POJO、Query 命名规范_dto命名规范-程序员宅基地

文章浏览阅读7.6k次,点赞2次,收藏8次。1.分层领域模型规约: • DO( Data Object):与数据库表结构一一对应,通过DAO层向上传输数据源对象。 • DTO( Data Transfer Object):数据传输对象,Service或Manager向外传输的对象。 • BO( Business Object):业务对象。 由Service层输出的封装业务逻辑的对象。 • AO( Ap..._dto命名规范

1015. Reversible Primes (20) PAT甲级刷题_pat甲级1015-程序员宅基地

文章浏览阅读91次。A reversible prime in any number system is a prime whose "reverse" in that number system is also a prime. For example in the decimal system 73 is a reversible prime because its reverse 37 is also a pr..._pat甲级1015

ABAP接口之Http发送json报文_abap http 转换为json输出-程序员宅基地

文章浏览阅读1.5k次。ABAP接口之Http发送json报文abap 调用http 发送 json 测试函数SE11创建结构:zsmlscpnoticeSE37创建函数:zqb_test_http_fuc1FUNCTIONzqb_test_http_fuc1.*"----------------------------------------------------------------..._abap http 转换为json输出