spectralloader.py

import glob
import os
import mmap
from multiprocessing import pool

import torch
import tqdm as tqdm
from concurrent.futures.thread import ThreadPoolExecutor
from concurrent.futures.process import ProcessPoolExecutor
from torch.utils.data import Dataset
import pickle
import numpy as np
import random
from tqdm import tqdm
import multiprocessing as mp
import cv2
from shutil import move
from os import rmdir
import gc
import time
from copy import deepcopy
from PIL import Image
from helpfunctions import *

from torchvision import transforms
import torchvision.datasets as t_datasets


class Spectralloader(Dataset):
    """
        The spektral dataset can be found in folder

        /home/schramowski/datasets/deepplant/data/parsed_data/Z/VNIR/

        The folder structure of the dataset is as follows::

            └── VNIR
                ├── 1_Z1
                │   └── segmented_leafs
                │       ├── data.p
                │       └── memmap.dat
                ├── 1_Z2
                │   └── segmented_leafs
                │       ├── data.p
                │       └── memmap.dat
                ├──
                 ...
                ├──
                ├── 1_Z13
                │   └── segmented_leafs
                │       ├── data.p
                │       └── memmap.dat
                ├── 2_Z1
                │   └── segmented_leafs
                │       ├── data.p
                │       └── memmap.dat
                ├──
                ├──
                ├── 4_Z18
                │   └── segmented_leafs
                │       ├── data.p
                │       └── memmap.dat


                Platte Z1 - Z18
                Tag der Aufnahme: 1
                1_Z1 - 1_Z13
                Tag der Aufnahme: 2
                2_Z1 - 2_Z18
                Tag der Aufnahme: 3
                3_Z1 - 3_Z18
                Tag der Aufnahme: 4
                4_Z1 - 4_Z18


                train and valid Dataset

                Beispiel für ein Blatt:
                1_Z3_2_0_1;0
                    2_0_1 id des Blattes
                    0 steht für gesund; 1 für krank

                Image format
                (213, 255, 328)
                RGB format
                (213, 255, 3)
                from learning to RGB
                (1, 2, 0)
                from RGB to learning
                (2,0,1)
                learning format
                (3, 213, 255)
                RGB channels
                [50, 88, 151]
                SWIR
                [24, 51, 118]


        """

    def __init__(self, ids_and_labels, root, mode, train, transform=None):
        # Parameter:
        # ids_and_labels: list of all IDs with their corresponding labels
        # Variables:
        # mode: either 'imagenet' or 'plants' determine the correct DS to load from
        # ids: list of all ids in order of data
        # data: dictionary of all IDs with their corresponding images and label
        #  data[id]['image'] = image, data[id]['label'] = label
        gc.enable()
        self.mode = mode
        self.train = train
        self.classes = []
        self.percentage = None
        self.mask = None
        self.explainer = None
        self.DEVICE = None
        # is new roar image to be calculated
        self.update_roar_images = False
        if self.mode == 'plants':
            if self.train == 'train':
                self.norm = transforms.Compose([
                    transforms.ToPILImage(),
                    transforms.Resize((224, 224), interpolation=Image.BICUBIC),
                    # transforms.RandomRotation(20),
                    # transforms.RandomHorizontalFlip(0.5),
                    transforms.ToTensor(),
                    # transforms.Normalize(mean=[0.485, 0.456, 0.406],
                    #                      std=[0.229, 0.224, 0.225])
                ])
            else:
                self.norm = transforms.Compose([
                    transforms.ToPILImage(),
                    transforms.Resize((224, 224), interpolation=Image.BICUBIC),
                    transforms.ToTensor(),
                    # transforms.Normalize(mean=[0.485, 0.456, 0.406],
                    #                      std=[0.229, 0.224, 0.225])
                    ])
        if self.mode == 'imagenet':
            if self.train == 'train':
                self.norm = transforms.Compose([
                    transforms.RandomHorizontalFlip(0.5),
                    transforms.ToTensor(),
                    transforms.Normalize(mean=[0.485, 0.456, 0.406],
                                         std=[0.229, 0.224, 0.225])
                ])
            else:
                self.norm = transforms.Compose([
                    transforms.ToTensor(),
                    transforms.Normalize(mean=[0.485, 0.456, 0.406],
                                         std=[0.229, 0.224, 0.225])
                    # transforms.Normalize([0.4802, 0.4481, 0.3975], [0.2302, 0.2265, 0.2262]),
                ])

        self.pil_to_tensor = transforms.Compose([
            transforms.ToTensor()
        ])
        self.tensor_to_pil = transforms.Compose([
            transforms.ToPILImage()
        ])
        self.data, self.ids = self.load_images_for_labels(root, ids_and_labels, train)
        gc.disable()

        # old normalization
        # transforms.Normalize([0.4802, 0.4481, 0.3975], [0.2302, 0.2265, 0.2262]),

    def __getitem__(self, index):
        # return only 1 sample and label according to "Index"
        id = self.get_id_by_index(index)
        image, label = self.get_by_id(id)
        return image, label

    def __len__(self):
        return len(self.ids)

    # update value in dataset with the new specified value
    def update_data(self, id, val, roar_link):
        try:
            if self.mode == 'imagenet':
                # show_image(val, 'original')
                # do not create new image if exist
                im = self.tensor_to_pil(val)
                im.save(roar_link)
                _, label = self.data[id]
                self.data[id] = (roar_link, label)
            else:
                # self.data[id]['image'] = self.tensor_to_pil(val)
                self.data[id]['image'] = val

        except ValueError:
            print('image with id: ' + str(id) + ' not in dataset')

    def get_id_by_index(self, index):
        try:
            return self.ids[index]
        except ValueError:
            print('Index out of bound: ' + str(index))
            return None

    def get_original_by_id(self, id):
        if self.mode == 'imagenet':
            image_path, label = self.data[id]
            im = Image.open(image_path)
            image = self.pil_to_tensor(im)
        else:
            image, label = self.data[id]['image'], self.data[id]['label']
            # image = self.pil_to_tensor(image)
            image = image
        return image, label

    def get_by_id(self, id):
        try:
            if self.mode == 'imagenet':
                image_path, label = self.data[id]
                image = Image.open(image_path).convert('RGB')
            else:
                image, label = self.data[id]['image'], self.data[id]['label']
            image = self.norm(image)
            return image, label
        except ValueError:
            print('image with id: ' + id + ' not in dataset')
            return None, None

    # returns an Array of IDs and a dictionary of all IDs with their corresponding images and label
    def load_images_for_labels(self, root_path, ids_and_labels, train):
        data = {}
        ids = []

        # add image with corresponding label and id to the DS
        def add_to_data(image, id):
            for (k, label) in ids_and_labels:
                if k == id:
                    data[id] = {}
                    # im = Image.fromarray((image * 160).astype(np.uint8), 'RGB')
                    image[image > 1] = 1
                    im = torch.from_numpy(np.transpose(image, to_learning))
                    # im = self.tensor_to_pil(im)
                    # im.save('./data/plants/test/' + id + '.png')
                    # conversion error in float to uint8 255 replaced with 160 because of range 0-1,6
                    data[id]['image'] = im
                    data[id]['label'] = label
                    ids.append(k)

        if self.mode == 'imagenet':
            data_dir = 'data/' + self.mode + '/' + 'tiny-imagenet-200'
            image_datasets = {x: t_datasets.ImageFolder(os.path.join(data_dir, x))
                              for x in ['train', 'val']}
            len_train = image_datasets['train'].__len__()
            len_val = image_datasets['val'].__len__()
            len_all = len_val + len_train
            # safe image classesnames in classes
            with open('./data/imagenet/tiny-imagenet-200/words.txt', 'r') as f:
                words = {}
                for line in f:
                    label = ''
                    name = ''
                    lab = True
                    for element in line.split():
                        if lab:
                            lab = False
                            label = element
                        else:
                            name += element
                            name += ' '
                    words[label] = name[:-1]
            self.classes = [words[cl] for cl in image_datasets['train'].classes]

            if train == 'train':
                data = {c: x for c, x in enumerate(image_datasets['train'].imgs)}
                ids = list(range(len_train))
            elif train == 'val':
                data = {c + len_train: x for c, x in enumerate(image_datasets['val'].imgs)}
                ids = list(range(len_train, len_all))
            elif train == 'specific':
                self.update_roar_images = True
                data = {}
                ids = [id for (id, label) in ids_and_labels]
                for c, x in enumerate(image_datasets['train'].imgs + image_datasets['val'].imgs):
                    if c in ids:
                        data[c] = x
            elif train == 'all':
                data = {c: x for c, x in enumerate(image_datasets['train'].imgs + image_datasets['val'].imgs)}
                ids = list(range(len_all))
        else:
            self.classes = ['healthy', 'diseased']

            # loads all the images have existing entry labels in the plant DS
            def load_image(path):
                dict = pickle.load(open(path + '/data.p', 'rb'))
                shape = dict['memmap_shape']
                samples = dict['samples']
                data_all = np.memmap(path + '/memmap.dat', mode='r', shape=shape, dtype='float32')
                for k, i in enumerate(samples):
                    # only add if we have a label for the image
                    data = data_all[k][:, :, [50, 88, 151]]
                    add_to_data(data, i['id'].replace(',', '_'))
                    # 255 elif mode == 'spec': reserved for spectral implementation
                    #     add_to_data(data_all[k].reshape(3, 255, 213), i['id'].replace(',', '_'))

            with tqdm(total=67, desc='loading images for DS') as progress:
                for i in range(1, 5):
                    if i == 1:
                        for k in range(1, 14):
                            progress.update(1)
                            load_image(root_path + str(i) + '_Z' + str(k) + '/segmented_leafs')
                    else:
                        for k in range(1, 19):
                            progress.update(1)
                            if not (k == 16 and i == 4):
                                load_image(root_path + str(i) + '_Z' + str(k) + '/segmented_leafs')
        return data, ids

    def get_roar_directory(self, method, id, explainer):
        if method == 'mean':
            method_text = ''
        else:
            # comparison value to better detect removed values
            # modify method only significant images get roared
            method_text = '/' + method
        im_dir, label = self.data[int(id)]
        index = im_dir.find('/tiny-imagenet-200')
        roar_link = im_dir[:index] + '/roar_images' + method_text + im_dir[index:]
        index = roar_link.find('.JPEG')
        roar_link = roar_link[:index] + '_' + explainer + '_' + str(self.percentage) + roar_link[index:]
        index = roar_link.find('/images')
        if not os.path.exists(roar_link[:index] + '/images'):
            os.makedirs(roar_link[:index] + '/images')
        return roar_link

    # masks imagenet -> dir to exp
    def apply_roar_single_image(self, percentage, masks, id, method, explainer):
        start_time = time.time()
        im = None
        self.percentage = percentage
        try:
            im, label = self.get_original_by_id(id)
            roar_link = None
            if self.mode == 'imagenet':
                roar_link = self.get_roar_directory(method, id, explainer)
            if self.mode == 'imagenet' and os.path.exists(roar_link) and not self.update_roar_images:
                self.data[id] = (roar_link, label)
            else:
                im = deepcopy(im).cpu().detach().numpy()
                if im is not None:
                    mean = np.mean(im)
                    if self.mode == 'plants':
                        max_i = 255
                        mask = masks[str(id)]
                    else:
                        masks_path = './data/imagenet/exp/'
                        max_i = 255
                        with open(masks_path + 'heatmaps/' + explainer + '/' + str(id) + '.pkl', 'rb') as f:
                            mask = pickle.load(f)
                    # only take percentile of values with duplicated zeros deleted
                    c, h, w = im.shape
                    # fast remove but not random selected values if values are equal
                    if explainer != 'guided_gradcam':
                        number_of_re_pixel = round(h * w * percentage / 100)
                        ind = np.argpartition(mask.flatten(), -number_of_re_pixel)[-number_of_re_pixel:]

                        for index in ind:
                            i_h = index // w
                            i_w = index - i_h * w
                            if method == "mean":
                                im[0][i_h][i_w] = mean
                                im[1][i_h][i_w] = mean
                                im[2][i_h][i_w] = mean
                            else:
                                im[0][i_h][i_w] = 238 / max_i
                                im[1][i_h][i_w] = 173 / max_i
                                im[2][i_h][i_w] = 14 / max_i
                        self.update_data(id, torch.from_numpy(im), roar_link)
                    else:
                        # use for random pixel if all have val 0
                        mask_flat = mask.flatten()
                        percentile = np.percentile(mask_flat, 100 - percentage)
                        bigger = 0
                        indices_of_same_values = []

                        for i in range(0, w):
                            for j in range(0, h):
                                if mask[j][i] > percentile:
                                    bigger += 1
                                    if method == "mean":
                                        im[0][j][i] = mean
                                        im[1][j][i] = mean
                                        im[2][j][i] = mean
                                    else:
                                        im[0][j][i] = 238 / max_i
                                        im[1][j][i] = 173 / max_i
                                        im[2][j][i] = 14 / max_i
                                if mask[j][i] == percentile:
                                    indices_of_same_values.append([j, i])
                        if len(indices_of_same_values) > 5:
                            missing = max(int(0.01 * percentage * w * h - bigger), 0)
                            selection = random.sample(indices_of_same_values, missing)
                            for i in selection:
                                if method == "mean":
                                    im[0][i[0]][i[1]] = mean
                                    im[1][i[0]][i[1]] = mean
                                    im[2][i[0]][i[1]] = mean
                                else:
                                    im[0][i[0]][i[1]] = 238 / max_i
                                    im[1][i[0]][i[1]] = 173 / max_i
                                    im[2][i[0]][i[1]] = 14 / max_i
                        self.update_data(id, torch.from_numpy(im), roar_link)
                    del im
            # print('init: ' + str(round(t2, 3)) + ' modify: ' + str(round(t3, 3)) + ' update: ' + str(round(t4, 3)))
            # print('used time to modify: ' + str(round(time.time() - start_time, 3)))
        except ValueError:
            print('No roar img or mask for id: ' + str(id))

    # apply the roar to the dataset
    # given percentage of the values get removed from the dataset
    def apply_roar(self, percentage, path, DEVICE, explainer, model_type):
        if self.mode == 'plants':
            with open(path + 'heatmaps/heatmaps_' + model_type + '_' + explainer + '.pkl', 'rb') as f:
                masks = pickle.load(f)
        else:
            masks = path
        self.percentage = percentage
        self.explainer = explainer
        self.DEVICE = DEVICE
        length = self.__len__()
        text = 'removing ' + str(percentage) + '% of ' + explainer

        # parallel execution not working
        # pool = mp.Pool(processes=4)
        with tqdm(total=length, desc=text, ncols=100) as progress:
            def log_result():
                progress.update(1)

            # with ProcessPoolExecutor(max_workers=4) as executor:
            #     executor.map(self.apply_roar_single_image,
            #                           [(percentage, masks, self.get_id_by_index(d), "mean", explainer) for d in
            #                            range(0, length)])

            for d in range(0, length):
                id = self.get_id_by_index(d)
                self.apply_roar_single_image(percentage, masks, id, "mean", explainer)
                log_result()
                # pool.apply_async(self.apply_roar_single_image, args=(percentage, masks, id, "mean", explainer),
                #              callback=log_result)
        # pool.close()
        # pool.join()
        # r = list(tqdm.tqdm(pool.imap_unordered(self.apply_roar_single_image, data), total=length, desc=text))
        # with tqdm(total=length, desc=text) as progress:
        #     for d in range(0, length):
        #         id = self.get_id_by_index(d)
        #         self.apply_roar_single_image(percentage, masks, id, "mean", explainer)
        #         progress.update(1)

    def get_class_by_label(self, label_id):
        return self.classes[int(label_id)]
        # if self.mode == 'plants':
        #     if label_id == 0:
        #         return self.classes[0]
        #     else:
        #         return self.classes[1]
        # else:
        #     with open('./data/imagenet/tiny-imagenet-200/wnids.txt', 'r') as f:
        #         wnids = [line.rstrip('\n') for line in f]
        #     with open('./data/imagenet/tiny-imagenet-200/words.txt', 'r') as f:
        #         words = {}
        #         for line in f:
        #             label = ''
        #             name = ''
        #             lab = True
        #             for element in line.split():
        #                 if lab:
        #                     lab = False
        #                     label = element
        #                 else:
        #                     name += element
        #                     name += ' '
        #             words[label] = name[:-1]
        #     return words[wnids[int(label_id)]]


# returns Array of tuples(String, int) with ID and disease information 0 disease/ 1 healthy e.g. (3_Z2_1_0_1, 0)
# returns Array of tuples(String, int) with ID and class information e.g. (test_9925.JPEG n01910747)
# train Array of tuples(String, int) with ID and class information
# valid Array of tuples(String, int) with ID and class information
# all_data Array of tuples(String, int) with ID and class information
# all_labels Array of int with class information
def load_labels(mode):
    valid = []
    train = []
    all_labels = []
    val_labels = []
    train_labels = []

    # load all imagenet labels use the index as the id as a unique identifier
    if mode == 'imagenet':
        data_dir = 'data/' + mode + '/' + 'tiny-imagenet-200'
        image_datasets = {x: t_datasets.ImageFolder(os.path.join(data_dir, x)) for x in ['train', 'val']}
        train_labels = image_datasets['train'].targets
        train = [(str(c), i) for c, i in enumerate(train_labels)]
        # val_labels = image_datasets['val'].targets
        # valid = [(str(len(train_labels) + c), len(train_labels) + i) for c, i in enumerate(val_labels)]
        all_labels = train_labels + val_labels
    else:
        # mp.set_start_method('spawn')
        path_test = 'data/' + mode + '/' + 'test_fileids.txt'
        path_train = 'data/' + mode + '/' + 'train_fileids.txt'
        valid_s = open(path_test, 'r').readlines()
        train_s = open(path_train, 'r').readlines()
        for i in valid_s:
            data = i.split(';')
            valid.append((data[0], int(data[1])))
            all_labels.append(int(data[1]))
        for i in train_s:
            data = i.split(';')
            train.append((data[0], int(data[1])))
            all_labels.append(int(data[1]))
    return train, valid, train + valid, all_labels


def upscale_imagenet():
    target_size = 224
    all_images = glob.glob('data/imagenet/tiny-imagenet-200/*/*/*/*')

    def resize_img(image_path, size):
        img = cv2.imread(image_path)
        img = cv2.resize(img, (size, size), interpolation=cv2.INTER_CUBIC)
        cv2.imwrite(image_path, img)

    text = 'upscaling images from imagenet'
    with tqdm(total=len(all_images), desc=text) as progress:
        for image in all_images:
            resize_img(image, target_size)
            progress.update(1)


def val_format():
    target_folder = './data/imagenet/tiny-imagenet-200/val/'
    test_folder = './data/imagenet/tiny-imagenet-200/test/'

    val_dict = {}
    with open('./data/imagenet/tiny-imagenet-200/val/val_annotations.txt', 'r') as f:
        for line in f.readlines():
            split_line = line.split('\t')
            val_dict[split_line[0]] = split_line[1]

    paths = glob.glob('./data/imagenet/tiny-imagenet-200/val/images/*')
    for path in paths:
        file = path.split('/')[-1]
        folder = val_dict[file]
        if not os.path.exists(target_folder + str(folder)):
            os.mkdir(target_folder + str(folder))
            os.mkdir(target_folder + str(folder) + '/images')
        if not os.path.exists(test_folder + str(folder)):
            os.mkdir(test_folder + str(folder))
            os.mkdir(test_folder + str(folder) + '/images')

    for path in paths:
        file = path.split('/')[-1]
        folder = val_dict[file]
        if len(glob.glob(target_folder + str(folder) + '/images/*')) < 25:
            dest = target_folder + str(folder) + '/images/' + str(file)
        else:
            dest = test_folder + str(folder) + '/images/' + str(file)
        move(path, dest)

    rmdir('./data/imagenet/tiny-imagenet-200/val/images')