Keras样本增加神器-ImageDataGenerator

在我们学习机器学习的时候, 发现有一些问题 比如样本太少,或者预测的样本和训练的样本差距比较大?导致实际使用中网络输出的预测并不准确。因为网络取值的的特征是完全按照训练样本来的。 例如下图,这种情况网络预测就不会很准确。

所以,Keras给我提供了工具:
ImageDataGenerator 来解决样本不足或样本形式多样的问题。
ImageDG会根据我们设置的参数基于现有的样本生成更多形态的样本,例如:
1.改变位置
2.缩放
3.旋转等

#coding:utf-8
from keras.preprocessing.image import ImageDataGenerator,img_to_array
from keras.preprocessing import image
import numpy as np


#指定图像输入目录
img_path = ['pred_image/0.jpg','pred_image/1.jpg'] #根据实际情况添加

#把样本加入列表中
pre_img_array = []
for i in img_path:
    img = image.load_img(i)
    img = img_to_array(img)
    pre_img_array.append(img)

#图像转numpy数组 并 reshape
img = np.array(pre_img_array)
img = img.reshape(-1,100,100,3)
print img.shape

#设置图像生成器规则
img_gen = ImageDataGenerator(
    width_shift_range=0.2,  #横向移动
    height_shift_range=0.2, #纵向移动
#这里还有很多参数可以设置
)

i = 0
 #注意 img_gen.flow这里实际是一个生成器,每循环一次执行一次,返回一个图片数组到batch里
for batch in img_gen.flow(x=img,save_to_dir='pred_image/',save_prefix='cc', save_format='png',):
    print batch
    i+=1
    if i > 2:
        print 'done'
        break

参数参考
featurewise_center:布尔值,使输入数据集去中心化(均值为0), 按feature执行

samplewise_center:布尔值,使输入数据的每个样本均值为0

featurewise_std_normalization:布尔值,将输入除以数据集的标准差以完成标准化, 按feature执行

samplewise_std_normalization:布尔值,将输入的每个样本除以其自身的标准差

zca_whitening:布尔值,对输入数据施加ZCA白化

zca_epsilon: ZCA使用的eposilon,默认1e-6

rotation_range:整数,数据提升时图片随机转动的角度

width_shift_range:浮点数,图片宽度的某个比例,数据提升时图片水平偏移的幅度

height_shift_range:浮点数,图片高度的某个比例,数据提升时图片竖直偏移的幅度

shear_range:浮点数,剪切强度(逆时针方向的剪切变换角度)

zoom_range:浮点数或形如[lower,upper]的列表,随机缩放的幅度,若为浮点数,则相当于[lower,upper] = [1 - zoom_range, 1+zoom_range]

channel_shift_range:浮点数,随机通道偏移的幅度

fill_mode:;‘constant’,‘nearest’,‘reflect’或‘wrap’之一,当进行变换时超出边界的点将根据本参数给定的方法进行处理

cval:浮点数或整数,当fill_mode=constant时,指定要向超出边界的点填充的值

horizontal_flip:布尔值,进行随机水平翻转

vertical_flip:布尔值,进行随机竖直翻转

rescale: 重放缩因子,默认为None. 如果为None或0则不进行放缩,否则会将该数值乘到数据上(在应用其他变换之前)

preprocessing_function: 将被应用于每个输入的函数。该函数将在图片缩放和数据提升之后运行。该函数接受一个参数,为一张图片(秩为3的numpy array),并且输出一个具有相同shape的numpy array

data_format:字符串,“channel_first”或“channel_last”之一,代表图像的通道维的位置。该参数是Keras 1.x中的image_dim_ordering,“channel_last”对应原本的“tf”,“channel_first”对应原本的“th”。以128x128的RGB图像为例,“channel_first”应将数据组织为(3,128,128),而“channel_last”应将数据组织为(128,128,3)。该参数的默认值是~/.keras/keras.json中设置的值,若从未设置过,则为“channel_last”