folder.py

# coding: UTF-8

# some ideas and code taken  from : https://github.com/hjptriplebee huangjipengnju@gmail.com

# based on tensorflow/example/tutorials deepdream
# some ideas and code taken from : https://github.com/hjptriplebee huangjipengnju@gmail.com


import os
import argparse
import tensorflow as tf
import numpy as np
# export pbr version for tensorflow user
os.environ["PBR_VERSION"] = '3.1.1'

import cv2
import random
import re
import glob

# parameter
model_name = "tensorflow_inception_graph.pb"
imagenet_mean = 120.0
layer = 'mixed4c'
iter_num = 1
octave_num = 1
octave_scale = 1.4
learning_rate = 1.5
tile_size = 512
noise = np.random.uniform(size=(224, 224, 3)) + 100.0

numbers = re.compile(r'(\d+)')


def numericalSort(value):
    parts = numbers.split(value)
    parts[1::2] = map(int, parts[1::2])
    return parts


layer_names = ['conv2d0', 'conv2d1', 'conv2d2',
               'mixed3a', 'mixed3b',
               'mixed4a', 'mixed4b', 'mixed4c', 'mixed4d', 'mixed4e',
               'mixed5a', 'mixed5b']
no_conv = ['mixed3a', 'mixed3b',
           'mixed4a', 'mixed4b', 'mixed4c', 'mixed4d', 'mixed4e',
           'mixed5a', 'mixed5b']
layer_conv = ['conv2d0', 'conv2d1', 'conv2d2']


def define_args():
    """define args"""
    parser = argparse.ArgumentParser(description="deep_dream")
    parser.add_argument("-i", "--input", help="input path", default="none")
    parser.add_argument("-o", "--output", help="output path",
                        default="output/output.jpg")
    parser.add_argument("-it", "--iterations",
                        help="specify iterations", default="4")
    parser.add_argument(
        "-li", "--linear", help="specify linear increase in iterations", default="0")
    parser.add_argument("-oc", "--octaves",
                        help="specify octaves", default="2")
    parser.add_argument(
        "-la", "--layer", help="specify layer name", default="mixed4c")
    parser.add_argument("-rl", "--randomlayer",
                        help="specify random layer", default="Default")
    parser.add_argument("-rle", "--randomlayerevery",
                        help="specify random layer every n frames", default="0")
    parser.add_argument(
        "-iw", "--itwaver", help="randomize the number of iterations up and down by this amount", default="0")
    parser.add_argument(
        "-ow", "--ocwaver", help="randomize the number of octaves up and down by this amount", default="0")
    return parser.parse_args()


def get_model():
    """download model"""
    model = os.path.join("model", model_name)
    if not os.path.exists(model):
        print("Down model...")
        os.system(
            "wget https://storage.googleapis.com/download.tensorflow.org/models/inception5h.zip -P model")
        os.system("unzip model/inception5h.zip -d model")
        os.system("rm model/inception5h.zip")
        os.system("rm model/imagenet_comp_graph_label_strings.txt")
    return model


def deep_dream(model, output_path, input_image=noise):
    # take input args chosen for parameters
    iter_num = int(args.iterations)
    octave_num = int(args.octaves)
    layer = str(args.layer)
    print("layer is : ", layer)
    """implement of deep dream"""
    # define graph
    graph = tf.Graph()
    sess = tf.InteractiveSession(graph=graph)

    # load model
    with tf.gfile.FastGFile(model, "rb") as f:
        graph_def = tf.GraphDef()
        graph_def.ParseFromString(f.read())

    # define input
    X = tf.placeholder(tf.float32, name="input")
    X2 = tf.expand_dims(X - imagenet_mean, 0)
    tf.import_graph_def(graph_def, {"input": X2})

    print("\n", iter_num, "\n")

    count = 1
    output_count = len([name for name in os.listdir(
        '.') if os.path.isfile(args.input + '/output')])
    count = output_count + 1
    rl = str(args.randomlayer)
    rle = int(args.randomlayerevery)
    print("what is args.randomlayer: " + rl, "done every ", str(rle), "frames")
    file_list = sorted(glob.iglob(args.input + '/*.png'), key=numericalSort)
    for image_file in file_list:
        if count < output_count:  # hack to finish a partially completed job
            count += 1
            continue
        if rle != 0 and rle % count:  # only randomize every n frames
            print("random layer in ", str(rl), " frames")
            if "nc" in rl:
                layer = random.choice(no_conv)
                print("layer is noconv", layer)
            elif "random" in rl:
                layer = random.choice(layer_names)
                print("layer is rl ", layer)
            elif "c" in rl:
                layer = random.choice(layer_conv)
                print("random layer choice is ", layer)

        # L2 and gradient
        loss = tf.reduce_mean(
            tf.square(graph.get_tensor_by_name("import/%s:0" % layer)))
        gradient = tf.gradients(loss, X)[0]
        # increase iterations this run if doing linear increase
        if int(args.linear) > 0 and iter_num < 500:
            iter_num += int(args.linear)
            print("increase iter_num to ", iter_num)
        iw = int(args.itwaver)
        r = bool(random.getrandbits(1))
        if iw > 0:
            if iter_num > iw:
                if r and iter_num < 500:
                    iter_num += iw
                else:
                    iter_num -= iw
            else:
                if not r:
                    iter_num += iw
        # ow = int(args.ocwaver)
        # r = bool(random.getrandbits(1))
        # if ow > 0:
        #     if octave_num > ow:
        #         if r and octave_num < 8:
        #                 octave_num += ow
        #         else:
        #             octave_num -=ow
        #     else:
        #         if not r:
        #             octave_num += ow

        image = np.float32(cv2.imread(image_file))
        octaves = []
        output_path = args.input + "/output/" + str(count) + ".png"
        print (output_path)
        count += 1
        # tranforming TF function

        def tffunc(*argtypes):
            placeholders = list(map(tf.placeholder, argtypes))

            def wrap(f):
                out = f(*placeholders)

                def wrapper(*args, **kw):
                    return out.eval(dict(zip(placeholders, args)), session=kw.get('session'))

                return wrapper

            return wrap

        def resize(image, size):
            """resize image in nparray"""
            image = tf.expand_dims(image, 0)
            return tf.image.resize_bilinear(image, size)[0, :, :, :]

        resize = tffunc(np.float32, np.int32)(resize)

        for i in range(octave_num - 1):
            size = np.shape(image)[:2]
            narrow_size = np.int32(np.float32(size) / octave_scale)
            # down sampling and up sampling equal to smooth, diff can save significance
            down = resize(image, narrow_size)
            diff = image - resize(down, size)
            image = down
            octaves.append(diff)

        def cal_gradient(image, gradient):
            """cal gradient"""
            # generate offset and shift to smooth tile edge
            shift_x, shift_y = np.random.randint(tile_size, size=2)
            image_shift = np.roll(np.roll(image, shift_x, 1), shift_y, 0)
            total_gradient = np.zeros_like(image)
            # calculate gradient for each region
            for y in range(0, max(image.shape[0] - tile_size // 2, tile_size), tile_size):
                for x in range(0, max(image.shape[1] - tile_size // 2, tile_size), tile_size):
                    region = image_shift[y:y + tile_size, x:x + tile_size]
                    total_gradient[y:y + tile_size, x:x +
                                   tile_size] = sess.run(gradient, {X: region})
            return np.roll(np.roll(total_gradient, -shift_x, 1), -shift_y, 0)

        for i in range(octave_num):
            print("octave num %s/%s..." % (i + 1, octave_num))
            if i > 0:
                # restore image except original image
                diff = octaves[-i]
                image = resize(image, diff.shape[:2]) + diff
            for j in range(iter_num):
                # gradient ascent
                g_ = cal_gradient(image, gradient)
                # large learning rate for small g_
                image += g_ * (learning_rate / (np.abs(g_).mean() + 1e-7))
        cv2.imwrite(output_path, image)


if __name__ == "__main__":
    args = define_args()
    model_path = get_model()
    deep_dream(model_path, args.output)