deepconcolic/main.py

#!/usr/bin/env python3
import argparse
from pathlib import Path
from utils_io import *
from utils_funcs import *
from utils import *
from bounds import UniformBounds, StatBasedInputBounds
import fuzzer, datasets
import filters
import plugins
import yaml


def deepconcolic(criterion, norm, test_object, report_args,
                 engine_args = {},
                 norm_args = {},
                 dbnc_spec = {},
                 input_bounds = None,
                 postproc_inputs = id,
                 run_engine = True,
                 **engine_run_args):
  test_object.check_layer_indices (criterion)
  engine = None
  if criterion=='nc':                   ## neuron cover
    from nc import setup as nc_setup
    if norm=='linf':
      from pulp_norms import LInfPulp
      from nc_pulp import NcPulpAnalyzer
      engine = nc_setup (test_object = test_object,
                         engine_args = engine_args,
                         setup_analyzer = NcPulpAnalyzer,
                         input_metric = LInfPulp (**norm_args),
                         input_bounds = input_bounds,
                         postproc_inputs = postproc_inputs)
    elif norm=='l0':
      from nc_l0 import NcL0Analyzer
      l0_args = copy.copy (norm_args)
      del l0_args['LB_noise']
      engine = nc_setup (test_object = test_object,
                         engine_args = engine_args,
                         setup_analyzer = NcL0Analyzer,
                         input_shape = test_object.raw_data.data[0].shape,
                         eval_batch = eval_batch_func (test_object.dnn),
                         postproc_inputs = postproc_inputs,
                         l0_args = l0_args)
    else:
      print('\n not supported norm... {0}\n'.format(norm))
      sys.exit(0)
  elif criterion=='bfc':                ## feature cover
    from dbnc import setup as dbnc_setup
    from dbnc import BFcCriterion
    if norm == 'linf':
      from pulp_norms import LInfPulp
      from dbnc_pulp import BFcPulpAnalyzerWithLinearExtrapolation as Analyzer
      engine = dbnc_setup (**dbnc_spec,
                           test_object = test_object,
                           engine_args = engine_args,
                           setup_criterion = BFcCriterion,
                           setup_analyzer = Analyzer,
                           input_metric = LInfPulp (**norm_args),
                           input_bounds = input_bounds,
                           postproc_inputs = postproc_inputs,
                           enable_linear_extrapolation = False,
                           fix_untargetted_components = True,
                           outdir = report_args['outdir'])
    elif norm=='l0':
      from dbnc_l0 import BFcL0Analyzer
      l0_args = copy.copy (norm_args)
      del l0_args['LB_noise']
      engine = dbnc_setup (**dbnc_spec,
                           test_object = test_object,
                           engine_args = engine_args,
                           setup_criterion = BFcCriterion,
                           setup_analyzer = BFcL0Analyzer,
                           input_shape = test_object.raw_data.data[0].shape,
                           eval_batch = eval_batch_func (test_object.dnn),
                           outdir = report_args['outdir'],
                           postproc_inputs = postproc_inputs,
                           l0_args = l0_args)
    else:
      sys.exit ('\n not supported norm... {0}\n'.format(norm))
  elif criterion=='bfdc':               ## feature-dependence cover
    from dbnc import setup as dbnc_setup
    from dbnc import BFDcCriterion
    if norm == 'linf':
      from pulp_norms import LInfPulp
      from dbnc_pulp import BFDcPulpAnalyzerWithLinearExtrapolation as Analyzer
      engine = dbnc_setup (**dbnc_spec,
                           test_object = test_object,
                           engine_args = engine_args,
                           setup_criterion = BFDcCriterion,
                           setup_analyzer = Analyzer,
                           input_metric = LInfPulp (**norm_args),
                           input_bounds = input_bounds,
                           postproc_inputs = postproc_inputs,
                           enable_linear_extrapolation = False,
                           fix_untargetted_components = True,
                           outdir = report_args['outdir'])
    else:
      sys.exit ('\n not supported norm... {0}\n'.format(norm))
  elif criterion=='dbnc_stats':
    import dbnc_stats
    dbnc_stats.run (test_object, report_args['outdir'],
                    input_bounds = input_bounds)
  elif criterion=='ssc':
    from ssc import SScGANBasedAnalyzer, setup as ssc_setup
    linf_args = copy.copy (norm_args)
    del linf_args['LB_hard']
    del linf_args['LB_noise']
    engine = ssc_setup (test_object = test_object,
                        engine_args = engine_args,
                        setup_analyzer = SScGANBasedAnalyzer,
                        ref_data = test_object.raw_data,
                        input_bounds = input_bounds,
                        postproc_inputs = postproc_inputs,
                        linf_args = linf_args)
  elif criterion=='ssclp':
    from pulp_norms import LInfPulp
    from mcdc_pulp import SScPulpAnalyzer
    from ssc import setup as ssc_setup
    engine = ssc_setup (test_object = test_object,
                        engine_args = engine_args,
                        setup_analyzer = SScPulpAnalyzer,
                        input_metric = LInfPulp (**norm_args),
                        input_bounds = input_bounds,
                        postproc_inputs = postproc_inputs,
                        concolic = True)
  elif criterion=='svc':
    from run_ssc import run_svc
    print('\n== Starting DeepConcolic tests for {0} =='.format (test_object))
    run_svc(test_object, report_args['outdir'])
  else:
    print('\n not supported coverage criterion... {0}\n'.format(criterion))
    sys.exit(0)

  if engine != None and run_engine:
    return engine, engine.run (**report_args, **engine_run_args)
  return engine


def main():

  parser = argparse.ArgumentParser \
    (description = 'Concolic testing for Neural Networks',
     prog = 'python3 -m deepconcolic.main',
     prefix_chars = '-+')
  parser.add_argument("--dataset", dest='dataset', required = True,
                      help="selected dataset", choices=datasets.choices)
  parser.add_argument ('--model', required = True,
                       help = 'the input neural network model (.h5 file or "vgg16")')
  parser.add_argument("--outputs", dest="outputs", required = True,
                      help="the output test data directory", metavar="DIR")
  # parser.add_argument("--training-data", dest="training_data", default="-1",
  #                     help="the extra training dataset", metavar="DIR")
  parser.add_argument("--criterion", dest="criterion", default="nc", required = True,
                      choices = ('nc', 'ssc', 'ssclp', 'bfc', 'bfdc'),
                      help = 'the test criterion')
  parser.add_argument("--norm", dest="norm", required = True, choices = ('l0', 'linf'),
                      help = 'the norm metric')
  parser.add_argument("--setup-only", dest="setup_only", action='store_true',
                      help="only setup the coverage critierion and analyzer, "
                      "and terminate before engine initialization and startup")
  parser.add_argument("--init", dest="init_tests", metavar="INT",
                      help="number of test samples to initialize the engine")
  parser.add_argument("--max-iterations", dest="max_iterations", metavar="INT",
                      help="maximum number of engine iterations (use < 0 for unlimited)",
                      default='-1')
  parser.add_argument("--save-all-tests", dest="save_all_tests", action="store_true",
                      help="save all generated tests in output directory; "
                      "only adversarial examples are kept by default")
  parser.add_argument("--rng-seed", dest="rng_seed", metavar="SEED", type=int,
                      help="Integer seed for initializing the internal random number "
                      "generator, and therefore get some(what) reproducible results")
  # parser.add_argument("--labels", dest="labels", default="-1",
  #                     help="the default labels", metavar="FILE")
  parser.add_argument("--extra-tests", '+i', dest='extra_testset_dirs', metavar="DIR",
                      type=Path, nargs="+",
                      help="additonal directories of test images")
  parser.add_argument("--filters", dest='filters', # nargs='+'
                      nargs=1, default=[],
                      help='additional filters used to put aside generated '
                      'test inputs that are too far from training data (there '
                      'is only one filter to choose from for now; the plural '
                      'is used for future-proofing)', choices=filters.choices)
  parser.add_argument('--norm-factor', metavar = 'FLOAT', type = float, default = 1/4,
                      help = 'norm distance upper threshold above which '
                      'generated inputs are rejected by the oracle (default is 1/4)')
  parser.add_argument('--lb-hard', metavar = 'FLOAT', type = float,
                      help = 'hard lower bound for the distance between '
                      'original and generated inputs (concolic engine only---'
                      'default is 1/255 for image datasets, 1/100 otherwise)')
  parser.add_argument('--lb-noise', metavar = 'FLOAT', type = float,
                      help = 'extra noise on the lower bound for the distance '
                      'between original and generated inputs (concolic engine '
                      'only---default is 1/10)')
  parser.add_argument("--mcdc-cond-ratio", dest="mcdc_cond_ratio", metavar = "FLOAT",
                      type = float, default = 0.01,
                      help ="the condition feature size parameter (0, 1]")
  parser.add_argument("--top-classes", dest="top_classes", metavar="CLS",
                      type = int, default = 1,
                      help = "check the top-CLS classifications for models that "
                      "output estimations for each class (e.g. VGG*)")
  parser.add_argument("--layers", dest="layers", nargs="+", metavar="LAYER",
                      help="test layers given by name or index")
  parser.add_argument("--feature-index", dest="feature_index", default="-1",
                      help="to test a particular feature map", metavar="INT")

  # DBNC-specific params
  parser.add_argument("--dbnc-spec", default="{}",
                      help="Feature extraction and discretisation specification",
                      metavar="SPEC")
  parser.add_argument('--dbnc-abstr', '--bn-abstr', metavar = 'PKL',
                      help = 'input BN abstraction (.pkl)')

  args = parser.parse_args ()

  # Initialize with random seed first, if given:
  try: rng_seed (args.rng_seed)
  except ValueError as e:
    sys.exit ("Invalid argument given for `--rng-seed': {}".format (e))

  inp_ub = 1
  lower_bound_metric_hard = None
  lower_bound_metric_noise = None

  dd = dataset_dict (args.dataset)
  train_data, test_data, kind, save_input, postproc_inputs, ib = \
    dd['train_data'], dd['test_data'], dd['kind'], \
    dd['save_input'], dd['postproc_inputs'], dd['input_bounds']
  amplify_diffs = kind in datasets.image_kinds
  if kind in datasets.image_kinds: # assume 256 res.
    lower_bound_metric_hard = 1 / 255
  input_bounds = (UniformBounds (*ib) if isinstance (ib, tuple) and len (ib) == 2 else \
                  StatBasedInputBounds (hard_bounds = UniformBounds (-1.0, 1.0)) \
                  if ib == 'normalized' else StatBasedInputBounds ())
  del dd

  if args.extra_testset_dirs is not None:
    for d in args.extra_testset_dirs:
      np1 (f'Loading extra image testset from `{str(d)}\'... ')
      x, y, _, _, _ = datasets.images_from_dir (str (d))
      x_test = np.concatenate ((x_test, x))
      y_test = np.concatenate ((y_test, y))
      print ('done')

  input_filters = []
  for f in args.filters:
    input_filters += xlist (filters.by_name (f))

  dnn = load_model (args.model)
  dnn.summary ()

  if args.model == 'vgg16':
    # XXX: that should be about loading some metadata with, e.g. args.dataset == 'ImageNet'.
    inp_ub = 255                # XXX: not really used (yet/anymore) I think
    input_bounds = UniformBounds (0.0, 255.0)
    postproc_inputs = fix_image_channels_ (up = None, down = None)
    save_input = save_an_image_ (channel_upscale = 1.)
    lower_bound_metric_hard = 1 / 255

  if args.lb_hard is not None:
    lower_bound_metric_hard = float (args.lb_hard)
    assert 0.0 < lower_bound_metric_hard <= 1.0
  lower_bound_metric_hard = some (lower_bound_metric_hard, 1/100)

  if args.lb_noise is not None:
    lower_bound_metric_noise = float (args.lb_noise)
    assert 0.0 <= lower_bound_metric_noise <= 1.0
  lower_bound_metric_noise = some (lower_bound_metric_noise, 1/10)

  input_bounds = some (input_bounds, UniformBounds (0.0, 1.0))
  postproc_inputs = some (postproc_inputs, id)

  test_object = test_objectt (dnn, train_data, test_data)
  test_object.cond_ratio = args.mcdc_cond_ratio
  test_object.postproc_inputs = postproc_inputs
  # NB: only used in run_ssc.run_svc (which is probably broken) >>
  test_object.top_classes = int (args.top_classes)
  test_object.inp_ub = inp_ub
  # <<<
  if args.layers is not None:
    try:
      test_object.set_layer_indices (int (l) if l.isdigit () else l
                                     for l in args.layers)
    except ValueError as e:
      sys.exit (e)
  if args.feature_index!='-1':
    test_object.feature_indices = [ int(args.feature_index) ]
    print ('feature index specified:', test_object.feature_indices)

  init_tests = int (args.init_tests) if args.init_tests is not None else None
  max_iterations = int (args.max_iterations)

  # DBNC-specific parameters:
  try:
    if args.dbnc_spec != "{}" and os.path.exists(args.dbnc_spec):
      with open(args.dbnc_spec, 'r') as f:
        dbnc_spec = yaml.safe_load (f)
    else:
      dbnc_spec = yaml.safe_load (args.dbnc_spec)
    if len (dbnc_spec) > 0:
      print ("DBNC Spec:\n", yaml.dump (dbnc_spec), sep='')
  except yaml.YAMLError as exc:
    sys.exit(exc)

  if args.dbnc_abstr is not None and os.path.exists(args.dbnc_abstr):
    dbnc_spec = dict () if dbnc_spec is None else dbnc_spec
    dbnc_spec['bn_abstr'] = args.dbnc_abstr
  elif args.dbnc_abstr is not None:
    sys.exit (f'BN abstraction file `{args.dbnc_abstr}\' missing')

  deepconcolic (args.criterion, args.norm, test_object,
                report_args = { 'outdir': OutputDir (args.outputs, log = True),
                                'save_new_tests': args.save_all_tests,
                                'save_input_func': save_input,
                                'amplify_diffs': amplify_diffs },
                norm_args = { 'factor': args.norm_factor,
                              'LB_hard': lower_bound_metric_hard,
                              'LB_noise': lower_bound_metric_noise },
                engine_args = { 'custom_filters': input_filters },
                dbnc_spec = dbnc_spec,
                input_bounds = input_bounds,
                postproc_inputs = postproc_inputs,
                run_engine = not args.setup_only,
                initial_test_cases = init_tests,
                max_iterations = max_iterations)

if __name__=="__main__":
  try:
    main ()
  except KeyboardInterrupt:
    sys.exit('Interrupted.')