run_cnn_test_k_savemysparsemil_new.py

from __future__ import print_function
import inbreast
import keras.backend as K
from roc_auc import RocAucScoreOp, PrecisionOp, RecallOp, F1Op
from roc_auc import AUCEpoch, PrecisionEpoch, RecallEpoch, F1Epoch, LossEpoch, ACCEpoch
#from keras.preprocessing.image import ImageDataGenerator
from image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation, Flatten, BatchNormalization, SpatialDropout2D
from keras.layers import advanced_activations
from keras.layers import Convolution2D, MaxPooling2D
from keras.optimizers import SGD, Adam, RMSprop
from keras.utils import np_utils
import numpy as np
from keras.callbacks import ModelCheckpoint
from keras.regularizers import l1l2
import inbreast
#import googlenet
from convnetskeras.convnets import preprocess_image_batch, convnet
import os
from sklearn import metrics
from sklearn.metrics import roc_auc_score,roc_curve
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import cross_val_score
np.random.seed(1)
#srng = RandomStreams(1)
fold = 0#1#2#3#4# 4
valfold = 2#4#4#1#0 #2
lr = 5e-5
nb_epoch = 500
batch_size = 80
l2factor =  5e-6 #5e-6 #1e-5#
l1factor = 0#2e-7
usedream = False
weighted = False #True
noises = 50
data_augmentation = True
modelname = 'alexnet' # miccai16, alexnet, levynet, googlenet
pretrain = True
#sparsemil = True
sparsemil = True
sparsemill1 = 1e-5 #5 #1e-5#2e-4
sparsemill2 = 0.0 #1e-2
savename = modelname+'new_fd'+str(fold)+'_vf'+str(valfold)+'_lr'+str(lr)+'_l2'+str(l2factor)+'_l1'\
+str(l1factor)+'_ep'+str(nb_epoch)+'_bs'+str(batch_size)+'_w'+str(weighted)+'_dr'+str(usedream)+str(noises)+str(pretrain)+'_sp'+str(sparsemil)+str(sparsemill1)+str(sparsemill2)+'ft'#+str(valnum)
print(savename)
nb_classes = 2
# input image dimensions
img_rows, img_cols = 227, 227
# the CIFAR10 images are RGB
img_channels = 1

# the data, shuffled and split between train and test sets
trX, y_train, teX, y_test, teteX, y_test_test = inbreast.loaddataenhance(fold, 5, valfold=valfold)
trY = y_train.reshape((y_train.shape[0],1))
teY = y_test.reshape((y_test.shape[0],1))
teteY = y_test_test.reshape((y_test_test.shape[0],1))
print('tr, val, te pos num and shape')
print(trY.sum(), teY.sum(), teteY.sum(), trY.shape[0], teY.shape[0], teteY.shape[0])
ratio = trY.sum()*1./trY.shape[0]*1.
print('tr ratio'+str(ratio))
weights = np.array((ratio, 1-ratio))
#trYori = np.concatenate((1-trY, trY), axis=1)
#teY = np.concatenate((1-teY, teY), axis=1)
#teteY = np.concatenate((1-teteY, teteY), axis=1)
X_train = trX.reshape(-1, img_channels, img_rows, img_cols)
X_test = teX.reshape(-1, img_channels, img_rows, img_cols)
X_test_test = teteX.reshape(-1, img_channels, img_rows, img_cols)
print('tr, val, te mean, std')
print(X_train.mean(), X_test.mean(), X_test_test.mean())
# convert class vectors to binary class matrices
Y_train = np_utils.to_categorical(y_train, nb_classes)
Y_test = np_utils.to_categorical(y_test, nb_classes)
Y_test_test = np_utils.to_categorical(y_test_test, nb_classes)
print('X_train shape:', X_train.shape)
print(X_train.shape[0], 'train samples')
print(X_test.shape[0], 'val samples')
print(X_test_test.shape[0], 'test samples')
model = Sequential()
if modelname == 'alexnet':
  X_train_extend = np.zeros((X_train.shape[0],3, 227, 227))
  for i in xrange(X_train.shape[0]):
    rex = np.resize(X_train[i,:,:,:], (227, 227))
    X_train_extend[i,0,:,:] = rex
    X_train_extend[i,1,:,:] = rex
    X_train_extend[i,2,:,:] = rex
  X_train = X_train_extend
  X_test_extend = np.zeros((X_test.shape[0], 3,227, 227))
  for i in xrange(X_test.shape[0]):
    rex = np.resize(X_test[i,:,:,:], (227, 227))
    X_test_extend[i,0,:,:] = rex
    X_test_extend[i,1,:,:] = rex
    X_test_extend[i,2,:,:] = rex
  X_test = X_test_extend
  X_test_test_extend = np.zeros((X_test_test.shape[0], 3, 227, 227))
  for i in xrange(X_test_test.shape[0]):
    rex = np.resize(X_test_test[i,:,:,:], (227,227))
    X_test_test_extend[i,0,:,:] = rex
    X_test_test_extend[i,1,:,:] = rex
    X_test_test_extend[i,2,:,:] = rex
  X_test_test = X_test_test_extend
  if pretrain:  # 227*227
    alexmodel = convnet('alexnet', weights_path='alexnet_weights.h5', heatmap=False, l1=l1factor, l2=l2factor)
    model = convnet('alexnet', outdim=2, l1=l1factor, l2=l2factor, sparsemil=sparsemil, sparsemill1=sparsemill1, sparsemill2=sparsemill2)
    for layer, mylayer in zip(alexmodel.layers, model.layers):
      print(layer.name)
      if mylayer.name == 'mil_1':
        break
      else:
        weightsval = layer.get_weights()
        print(len(weightsval))
        mylayer.set_weights(weightsval)
  else:
    model = convnet('alexnet', outdim=2, l1=l1factor,l2=l2factor, sparsemil=sparsemil, sparsemill1=sparsemill1, sparsemill2=sparsemill2)

X_test_test = X_test_test.astype('float32')
for f in os.listdir('./'):
  metric = ['f1']#['auc','f1','reca','prec','acc','loss']
  for m in metric:
    if f.endswith('.hdf5') and f.startswith(savename+m):
      print(f)
      weightname = f
      model.load_weights(weightname)
      mymodel = convnet('alexnet', outdim=2, l1=l1factor, l2=l2factor, sparsemil=sparsemil, sparsemill1=sparsemill1, sparsemill2=sparsemill2, saveact=True)
      for layer, mylayer in zip(model.layers, mymodel.layers):
        if mylayer.name == 'flatten':
          break
        weightsval = layer.get_weights()
        mylayer.set_weights(weightsval)
      y_pred_train = mymodel.predict(X_train)  # val for threshold
      #np.savetxt('deepfeatrain.txt', y_pred_val)
      #np.savetxt('trainlabel.txt', y_train)
      y_pred_val = mymodel.predict(X_test)  # val for threshold
      #np.savetxt('deepfeatval.txt', y_pred_val)
      #np.savetxt('vallabel.txt', y_test)
      y_pred_test = mymodel.predict(X_test_test)  # val for threshold
      #np.savetxt('deepfeatval.txt', y_pred_val)
      #np.savetxt('vallabel.txt', y_test_test)
      bestacc = 0
      bestdepth = 0
      print(y_pred_train.shape, y_pred_val.shape)
      data = np.concatenate((y_pred_train, y_pred_val), axis=0)
      label = np.concatenate([y_train, y_test])
      import xgboost as xgb 
      from xgboost.sklearn import XGBClassifier
      xgb1 = XGBClassifier(learning_rate=0.1, n_estimators=100000, max_depth=5, min_child_weight=1, gamma=0, \
      	subsample=0.8, colsample_bytree=0.8, objective='binary:logistic', nthread=16, scale_pos_weight=1, seed=0)
      xgb1.fit(data, label)
      ypred = xgb1.predict_proba(y_pred_test)
      y_pred_val = ypred[:,1]
      sortindex = np.argsort(y_pred_val)
      y_pred_val = y_pred_val[sortindex]
      y_test = y_test_test[sortindex]
      bestthre = y_pred_val[0]-0.01
      for thre in y_pred_val:
        if np.mean((y_pred_val > thre) == y_test) > bestacc:
          bestacc = np.mean((y_pred_val > thre) == y_test)
          print(bestacc)
          bestthre = thre
      bestdepth = 5
      bestchildweight = 1
      for max_depth in xrange(3, 10,1):
        for min_child_weight in xrange(1,10,1):
          xgb1 = XGBClassifier(learning_rate=0.1, n_estimators=100000, max_depth=max_depth, min_child_weight=min_child_weight, gamma=0,\
          	subsample=0.8, colsample_bytree=0.8, objective='binary:logistic', nthread=16, scale_pos_weight=1, seed=0)
          xgb1.fit(data, label)
          ypred = xgb1.predict_proba(y_pred_test)
          y_pred_val = ypred[:,1]
          sortindex = np.argsort(y_pred_val)
          y_pred_val = y_pred_val[sortindex]
          y_test = y_test_test[sortindex]
          bestthre = y_pred_val[0]-0.01
          for thre in y_pred_val:
            if np.mean((y_pred_val > thre) == y_test) > bestacc:
              bestacc = np.mean((y_pred_val > thre) == y_test)
              print(bestacc, max_depth, min_child_weight)
              bestdepth = max_depth
              bestchildweight = min_child_weight
              bestthre = thre
      bestgamma = 0
      for gamma in [0, 0.1, 0.2, 0.3, 0.4, 0.5]:
        xgb1 = XGBClassifier(learning_rate=0.1, n_estimators=100000, max_depth=bestdepth, min_child_weight=bestchildweight, gamma=gamma,\
          	subsample=0.8, colsample_bytree=0.8, objective='binary:logistic', nthread=16, scale_pos_weight=1, seed=0)
        xgb1.fit(data, label)
        ypred = xgb1.predict_proba(y_pred_test)
        y_pred_val = ypred[:,1]
        sortindex = np.argsort(y_pred_val)
        y_pred_val = y_pred_val[sortindex]
        y_test = y_test_test[sortindex]
        bestthre = y_pred_val[0]-0.01
        for thre in y_pred_val:
          if np.mean((y_pred_val > thre) == y_test) > bestacc:
            bestacc = np.mean((y_pred_val > thre) == y_test)
            print(bestacc, gamma)
            bestgamma = gamma
            bestthre = thre
      bestsubsample = 0.8
      bestcolsample = 0.8
      for subsample in [0.5, 0.55, 0.6, 0.65, 0.7, 0.75, 0.8, 0.85, 0.9, 0.95, 1]:
        for colsample_bytree in [0.5, 0.55, 0.6, 0.65, 0.7, 0.75, 0.8, 0.85, 0.9, 0.95, 1]:
          xgb1 = XGBClassifier(learning_rate=0.1, n_estimators=100000, max_depth=bestdepth, min_child_weight=bestchildweight, gamma=bestgamma,\
          	subsample=subsample, colsample_bytree=colsample_bytree, objective='binary:logistic', nthread=16, scale_pos_weight=1, seed=0)
          xgb1.fit(data, label)
          ypred = xgb1.predict_proba(y_pred_test)
          y_pred_val = ypred[:,1]
          sortindex = np.argsort(y_pred_val)
          y_pred_val = y_pred_val[sortindex]
          y_test = y_test_test[sortindex]
          bestthre = y_pred_val[0]-0.01
          for thre in y_pred_val:
            if np.mean((y_pred_val > thre) == y_test) > bestacc:
              bestacc = np.mean((y_pred_val > thre) == y_test)
              print(bestacc, subsample, colsample_bytree)
              bestsubsample = subsample
              bestcolsample = colsample_bytree
              bestthre = thre
      bestalpha = 0
      for alpha in [1e-6, 1e-5, 1e-4, 1e-3, 1e-2, 1e-1, 0, 1, 100]:
      	xgb1 = XGBClassifier(learning_rate=0.1, n_estimators=100000, max_depth=bestdepth, min_child_weight=bestchildweight, gamma=bestgamma,\
          	subsample=bestsubsample, colsample_bytree=bestcolsample, reg_alpha=alpha, objective='binary:logistic', nthread=16, scale_pos_weight=1, seed=0)
        xgb1.fit(data, label)
        ypred = xgb1.predict_proba(y_pred_test)
        y_pred_val = ypred[:,1]
        sortindex = np.argsort(y_pred_val)
        y_pred_val = y_pred_val[sortindex]
        y_test = y_test_test[sortindex]
        bestthre = y_pred_val[0]-0.01
        for thre in y_pred_val:
          if np.mean((y_pred_val > thre) == y_test) > bestacc:
            bestacc = np.mean((y_pred_val > thre) == y_test)
            print(bestacc, alpha)
            bestalpha = alpha
            bestthre = thre
      bestlr = 0.1
      for lr in [0.01, 0.001]:
      	xgb1 = XGBClassifier(learning_rate=lr, n_estimators=100000, max_depth=bestdepth, min_child_weight=bestchildweight, gamma=bestgamma,\
          	subsample=bestsubsample, colsample_bytree=bestcolsample, reg_alpha=bestalpha, objective='binary:logistic', nthread=16, scale_pos_weight=1, seed=0)
        xgb1.fit(data, label)
        ypred = xgb1.predict_proba(y_pred_test)
        y_pred_val = ypred[:,1]
        sortindex = np.argsort(y_pred_val)
        y_pred_val = y_pred_val[sortindex]
        y_test = y_test_test[sortindex]
        bestthre = y_pred_val[0]-0.01
        for thre in y_pred_val:
          if np.mean((y_pred_val > thre) == y_test) > bestacc:
            bestacc = np.mean((y_pred_val > thre) == y_test)
            print(bestacc, lr)
            bestlr = lr

      '''for depth in xrange(16):
        clf = RandomForestClassifier(n_estimators=5000, max_depth=depth+1, random_state=0)
        clf.fit(data, label)
        ypred = clf.predict(data)
        #print((label == ypred).mean())
        ypred = clf.predict_proba(y_pred_test)
        y_pred_val = ypred[:,1]
        sortindex = np.argsort(y_pred_val)
        y_pred_val = y_pred_val[sortindex]
        y_test = y_test_test[sortindex]
        bestthre = y_pred_val[0]-0.01
        for thre in y_pred_val:
          if np.mean((y_pred_val > thre) == y_test) > bestacc:
            bestacc = np.mean((y_pred_val > thre) == y_test)
            print(bestacc, depth)
            bestthre = thre
            bestdepth = depth+1
      bestleaf = 1
      for leaf in xrange(1,2**8):
        clf = RandomForestClassifier(n_estimators=5000, min_samples_leaf=leaf, max_depth=bestdepth, random_state=0)
        clf.fit(data, label)
        ypred = clf.predict(data)
        #print((label == ypred).mean())
        ypred = clf.predict_proba(y_pred_test)
        y_pred_val = ypred[:,1]
        sortindex = np.argsort(y_pred_val)
        y_pred_val = y_pred_val[sortindex]
        y_test = y_test_test[sortindex]
        bestthre = y_pred_val[0]-0.01
        for thre in y_pred_val:
          if np.mean((y_pred_val > thre) == y_test) > bestacc:
            bestacc = np.mean((y_pred_val > thre) == y_test)
            bestthre = thre
            bestleaf = leaf
            print(bestacc, leaf)
      print(bestacc)
      clf = RandomForestClassifier(min_samples_leaf=bestleaf, max_depth=bestdepth, random_state=0)
      clf.fit(data, label)
      ypred = clf.predict_proba(y_pred_test)
      print(ypred.shape)
      y_pred_val = ypred[:,1]
      sortindex = np.argsort(y_pred_val)
      y_pred_val = y_pred_val[sortindex]
      y_test = y_test_test[sortindex]
      bestacc, bestthre = np.mean(y_test == np.ones_like(y_test)), y_pred_val[0]-0.01
      for thre in y_pred_val:
        if np.mean((y_pred_val > thre) == y_test) > bestacc:
          bestacc = np.mean((y_pred_val > thre) == y_test)
          bestthre = thre
      print(bestthre, bestacc)
      fpr, tpr, thresholds = metrics.roc_curve(y_test_test, ypred, pos_label=1)
      print('auc', metrics.auc(fpr, tpr))
      print('acc', metrics.accuracy_score(y_test_test, ypred))'''