deid/tools/i2b2/classes.py

# Modified by Max Friedrich, 2018

import os
import re
from collections import defaultdict

import numpy as np
from lxml import etree

from .tags import PHITag, DocumentTag


class Token(object):
    """ Class designed to encapsulate the idea of a token.  This includes
    the token itself,  plus pre and post whitespace,  as well as the start and
    end positions of the token with-in the document that the token was parsed
    out of.  It also includes an 'index' attribute that can be set by external
    functions and classes (see TokenSequence).
    """

    def __init__(self, token, pre_ws, post_ws, index, start, end):
        self.token = token
        self.start = int(start)
        self.end = int(end)
        self.index = int(index)

        # pre whitespace
        self.pre_ws = pre_ws
        # post whitespace
        self.post_ws = post_ws

    def __repr__(self):
        format_str = "<{}: {}, {}, {}, i:{}, s:{}, e:{}>"
        return format_str.format(self.__class__.__name__,
                                 self.pre_ws.__repr__(),
                                 self.token.__repr__(),
                                 self.post_ws.__repr__(),
                                 self.index,
                                 self.start, self.end)

    def to_string(self):
        if self.index == 0:
            s = self.pre_ws + self.token + self.post_ws
        else:
            s = self.token + self.post_ws

        return s

    def __str__(self):
        return self.to_string()

    def __len__(self):
        return len(self.to_string())

    def _get_key(self):
        return (self.start, self.end)

    def __hash__(self):
        return hash(self._get_key())

    def __eq__(self, other):
        """ Test the equality of two tokens. Based on start and end values.
        """
        if other._get_key() == self._get_key() and other._get_key() == self._get_key():
            return True

        return False


class TokenSequence(object):
    """ Encapsulates the functionality of a sequence of tokens.  it is designed
    to parse using the tokenizer() classmethod,  but can use any other
    subclassed method as long as it returns a list of Token() objects.
    """
    tokenizer_re = re.compile(r'([a-zA-Z0-9]+)')

    token_cls = Token

    @classmethod
    def tokenizer(cls, text, start=0):

        # This could be a one-liner,  but we'll split it up
        # so its a litle clearer.

        # This generates a list of strings in the form
        # [WHTEPSACE, TOKEN, WHITESPACE, TOKEN ...]
        split_tokens = re.split(cls.tokenizer_re, text)

        # Handle Special case where there is only whitespace at the 
        # begining of text. This will add an empty token to the list
        # but will preserve the leading whitespace
        if len(split_tokens) == 1:
            split_tokens.extend(["", ""])

        # This generates trigrams from the list in the form
        # [(WHITESPACE, TOKEN, WHITESPACE),
        #  (TOKEN, WHITESPACE, TOKEN),
        #  (WHITESPACE, TOKEN, WHITESPACE)
        #  .... ]
        token_trigrams = list(zip(*[split_tokens[i:] for i in range(3)]))

        # This keeps only odd tuples from token trigrams,  ie:
        # [(WHITESPACE, TOKEN, WHITESPACE),
        #  (WHITESPACE, TOKEN, WHITESPACE),
        #  (WHITESPACE, TOKEN, WHITESPACE)
        #  .... ]
        token_tuples = [t for i, t in enumerate(token_trigrams)
                        if not bool(i & 1)]

        tokens = []
        index = 0

        # Calculate start and end positions of the non-whitespace/punctuation
        # and append the token with its index into the list of tokens.
        for pre, token, post in token_tuples:
            token_start = start + len(pre)
            token_end = token_start + len(token)
            start = token_end
            tokens.append(cls.token_cls(token, pre, post,
                                        index, token_start, token_end))
            index += 1

        return tokens

    def __init__(self, text, tokenizer=None, start=0):

        tokenizer = self.tokenizer if tokenizer is None else tokenizer

        if not isinstance(text, str):  # but instead is a list
            self.text = ''.join(str(t.to_string() for t in text))
            self.tokens = text

        else:
            self.text = text
            self.tokens = tokenizer(self.text, start=start)

        # If start is 0 we assume we're parsing a whole document
        # and not a sub-string of tokens.
        # if start == 0:
        assert len(self.text) == sum(len(t) for t in self.tokens), \
            "Tokenizer MUST return a list of strings with character " \
            "length equal to text length. \n\n{}\n\n{}".format(self.text,
                                                               "".join([t.to_string() for t in self.tokens]))

    @staticmethod
    def tokens_to_string(tokens):
        return ''.join([t.to_string() for t in tokens])

    def __str__(self):
        return self.tokens_to_string(self.tokens).encode('string_escape')

    def __repr__(self):
        fstr = "<{} '{}', s:{}, e:{}>"
        return fstr.format(self.__class__.__name__,
                           str(self) if len(str(self)) < 40
                           else str(self)[:37] + "...",
                           self[0].start,
                           self[-1].end)

    def __len__(self):
        return len(self.tokens)

    def __getitem__(self, index):
        return self.tokens[index]

    def __iter__(self):
        return self.tokens.__iter__()

    def __next__(self):
        return next(self.tokens)

    def subseq(self, other):
        """Test if we are a subsequence of other"""
        return all([t in other.tokens for t in self.tokens])


class PHIToken(Token):
    """Subclass of Token,  manages PHI name and TYPE attributes which are
    assined by the PHITokenSequence Class."""

    def __init__(self, token, pre_ws, post_ws, index, start, end):
        super(PHIToken, self).__init__(token, pre_ws, post_ws,
                                       index, start, end)
        self.name = ""
        self.TYPE = ""

    def __repr__(self):
        fstr = "<{}: {}, {}, {}, {}, {}, i:{}, s:{}, e:{}>"
        return fstr.format(self.__class__.__name__,
                           self.name,
                           self.TYPE,
                           self.pre_ws.__repr__(),
                           self.token.__repr__(),
                           self.post_ws.__repr__(),
                           self.index,
                           self.start, self.end)

    def _get_key(self):
        return (self.name, self.TYPE, self.start, self.end)


class PHITokenSequence(TokenSequence):
    """PHITokenSequence class adds PHI Tag attribute information to tokens so 
    that they can be evaluated as though they were PHI Tags."""
    token_cls = PHIToken

    def __init__(self, text, phi_tag, tokenizer=None, start=0):
        super(PHITokenSequence, self).__init__(text, tokenizer=tokenizer,
                                               start=start)

        for t in self.tokens:
            t.name = phi_tag.name
            t.TYPE = phi_tag.TYPE


class StandoffAnnotation(object):
    """ This class models a standoff annotation,  including parsing out file ID
    information,  processing text and tags into objectsand coverting these
    objects back into XML elements,  dicts, files, token sequences etc.
    """
    id_parser = re.compile(r'^(\d+)-(\d+)(.*)\.xml')
    ts_cls = TokenSequence

    def __init__(self, file_name=None, root="root"):
        self.patient_id = ''
        self.record_id = ''
        self.sys_id = ''
        self.file_name = None
        self.raw = None
        self.text = None
        self.root = root
        self.doc_tags = []
        self.tags = []
        self.phi = []
        self._tokens = None

        if file_name:
            if self.id_parser.match(os.path.basename(file_name)):
                self.patient_id, \
                self.record_id, \
                self.sys_id = self.id_parser.match(os.path.basename(file_name)) \
                    .groups()
            else:
                self.patient_id = os.path.splitext(os.path
                                                   .basename(file_name))[0]
        else:
            self.patient_id = None

        if file_name is not None:
            with open(file_name, 'r') as handle:
                self.parse_text_and_tags(handle.read())
                self.file_name = file_name

    @property
    def id(self):
        return self.patient_id + "-" + self.record_id

    @id.setter
    def id(self, value):
        self.patient_id, self.record_id = value.split("-")

    @property
    def token_sequence(self):
        if self._tokens is None:
            self._tokens = self.ts_cls(self.text,
                                       self.ts_cls.tokenizer)

        return self._tokens

    def tag_to_token_sequence(self, tag):
        try:
            seq = self.ts_cls(tag.text, start=int(tag.start))
            for token in seq:
                try:
                    token.index = self.token_sequence.tokens.index(token)
                except ValueError:
                    token.index = None
            return seq
        except:
            return []

    def __hash__(self):
        return hash(self.id)

    def __eq__(self, other):
        return self.id == other.id and other.id == self.id

    def get_annotation_tag_color(self, name):
        tag_colors = {"DIABETES": ('\033[31m', '\033[0m'),
                      "CAD": ('\033[31m', '\033[0m'),
                      "HYPERTENSION": ('\033[31m', '\033[0m'),
                      "HYPERLIPIDEMIA": ('\033[31m', '\033[0m'),
                      "SMOKER": ('\033[31m', '\033[0m'),
                      "OBESE": ('\033[31m', '\033[0m'),
                      "FAMILY_HIST": ('\033[31m', '\033[0m'),
                      "MEDICATION": ('\033[31m', '\033[0m')}

        try:
            return tag_colors[name]
        except KeyError:
            return ('\033[90m', '\033[0m')

    def get_annotator_marked_text(self):
        """ Go through marking the entire text with color codes used to
        identify different types of human annotations."""
        text = self.get_text()

        # This should ensure we have eliminated any overlapping positions
        # information
        positions = []
        for tag in self.get_tags():
            if hasattr(tag, "start") and hasattr(tag, "end"):
                positions.append((tag.get_start(), tag.get_end(), tag))

        if len(positions):
            positions.sort(key=lambda x: x[0])

            last_start = positions[0][0]
            last_end = positions[0][1]
            concat = []
            for start, end, t in positions[1:]:
                if start <= last_end:
                    if end >= last_end:
                        last_end = end
                else:
                    concat.append((last_start, last_end, t))
                    last_start = start
                    last_end = end

            concat.append((last_start, last_end, t))

            # return the text
            for start, end, tag in sorted(concat, key=lambda x: x[0],
                                          reverse=True):
                open_str, close_str = self.get_annotation_tag_color(tag.name)
                text = text[:start] + open_str
                text += text[start:end] + close_str + text[end:]

        return text

    def toElement(self, with_phi_tags=True,
                  with_annotator_tags=True,
                  with_doc_level=True):

        root = etree.Element(self.root)
        text = etree.SubElement(root, "TEXT")
        tags = etree.SubElement(root, "TAGS")
        text.text = etree.CDATA(self.text)

        if with_doc_level:
            for t in self.doc_tags:
                try:
                    e = t.toElement(with_annotator_tags=with_annotator_tags)
                    tags.append(e)
                # MAE convertion throws all tags into doc_tags, because regular
                # tags don't have the with_annotator_tags argument we need to
                # catch and append the regular tag here.
                except TypeError:
                    tags.append(t.toElement())
        elif with_annotator_tags and not with_doc_level:
            for t in self.doc_tags:
                for at in t.annotator_tags:
                    tags.append(at.toElement())

        if with_phi_tags is True:
            for t in self.get_phi():
                tags.append(t.toElement())

        return root

    def toListOfDicts(self, with_phi_tags=True,
                      with_annotator_tags=True,
                      with_doc_level=True,
                      attrs=None):
        tag_list = []
        for t in self.get_doc_tags():
            if with_doc_level:
                tag_list.append(t.toDict(attributes=attrs))
            if with_annotator_tags:
                for at in t.annotator_tags:
                    tag_list.append(at.toDict(attributes=attrs))
        if with_phi_tags:
            for t in self.get_phi():
                tag_list.append(t.toDict(attributes=attrs))

        return tag_list

    def toXML(self, **kwargs):

        pretty_print = kwargs.pop("pretty_print", True)

        return etree.tostring(self.toElement(**kwargs),
                              pretty_print=pretty_print,
                              xml_declaration=True, encoding='UTF-8')

    def save(self, **kwargs):
        """ Save the standoff annotation to either self.file_name or to a
        file defined by the key word argument "path." Accepts
          path
          pretty_print
          with_phi_tags
          with_annotator_tags
          with_doc_level
        keyword arguments. and passes those on to toXML before writing to
        file.
        """

        path = kwargs.pop("path", self.file_name)

        if "pretty_print" not in kwargs:
            kwargs["pretty_print"] = True

        if not os.path.exists(os.path.dirname(path)):
            os.makedirs(os.path.dirname(path))

        # MAE has some specific requirements for its XML parsing,  here
        # We remove all leading whitespace from tags, this could potentially
        # introduce bugs if information in the <TEXT></TEXT> element starts
        # with whitespace and the first character is a '<'
        if kwargs['pretty_print'] == "MAE":
            xml = self.toXML(**kwargs)

            with open(path, "w") as h:
                h.writelines([re.sub("^\s+<", "<", l + "\n")
                              for l in xml.split("\n")])

        else:
            with open(path, "w") as h:
                h.write(self.toXML(**kwargs))

        return True

    def __repr__(self):
        fstr = "<StandoffAnnotation ({}) {}: tags:{} phi:{}>"
        return fstr.format(self.sys_id,
                           self.id,
                           len(self.get_tags()),
                           len(self.get_phi()))

    def get_filename(self):
        return self.file_name

    def get_phi(self):
        return self.phi

    def get_text(self):
        return self.text

    def get_tag(self, ident):
        for t in self.get_tags():
            if t.id == ident:
                return t
        return None

    def get_doc_tags(self):
        if len(self.doc_tags) == 0:
            hash_dict = defaultdict(list)

            # hash our tags based on their document level annotation
            for a in self.get_tags():
                hash_dict[a.get_document_annotation()].append(a)

            # Give the document tags id's and make sure corrisponding annotator
            # tags are related to the correct document level tag through their
            # docid attribute.
            i = 0
            for doc_tag, annotator_tags in list(hash_dict.items()):
                doc_tag.id = "DOC%s" % i
                doc_tag.annotator_tags = annotator_tags

                self.doc_tags.append(doc_tag)
                i += 1

            self.doc_tags = self.doc_tags

        return self.doc_tags

    def get_tags(self):
        if len(self.tags) == 0:
            return [at for dt in self.doc_tags for at in dt.annotator_tags]
        else:
            return self.tags

    def get_sorted_tags(self, reverse=False):
        return sorted(self.get_tags(),
                      key=lambda tag: tag.get_start(), reverse=reverse)

    def parse_text_and_tags(self, text=None):
        if text is not None:
            self.raw = text

        soup = etree.fromstring(self.raw.encode("utf8"))
        self.root = soup.tag

        try:
            self.text = soup.find("TEXT").text
        except AttributeError:
            self.text = None

        # Handles files where PHI, and AnnotatorTags are all just
        # stuffed into tag element.
        for t, cls in list(PHITag.tag_types.items()):
            if len(soup.find("TAGS").findall(t)):
                for element in soup.find("TAGS").findall(t):
                    self.phi.append(cls(element))

        for t, cls in list(DocumentTag.tag_types.items()):
            if len(soup.find("TAGS").findall(t)):
                for element in soup.find("TAGS").findall(t):
                    if "start" in list(element.attrib.keys()) or \
                            "end" in list(element.attrib.keys()):
                        self.tags.append(cls(element))
                    else:
                        self.doc_tags.append(DocumentTag(element))


class Evaluate(object):
    def __init__(self, s_sas, g_sas,
                 filters=None, conjunctive=False, invert=False):
        self.tp = []
        self.fp = []
        self.fn = []
        self.doc_ids = []
        self.invert = invert
        self.conjunctive = conjunctive
        self.verbose = False

        if filters is None:
            self.filters = []
        else:
            self.filters = filters

        assert len(set([a.sys_id for a in list(s_sas.values())])) == 1, \
            "More than one annotator ID in this set of Annotations!"

        self.sys_id = list(s_sas.values())[0].sys_id

        for doc_id in list(set(s_sas.keys()) & set(g_sas.keys())):

            self.validate_text(g_sas[doc_id].text, s_sas[doc_id].text, doc_id)

            if filters is not None:
                # Get all doc tags for each tag that passes all the
                # predicate functions in filters
                if conjunctive:
                    if invert:
                        gold = set([t for t in self.get_tagset(g_sas[doc_id])
                                    if not all([f(t) for f in self.filters])])
                        sys = set([t for t in self.get_tagset(s_sas[doc_id])
                                   if not all([f(t) for f in self.filters])])
                    else:
                        gold = set([t for t in self.get_tagset(g_sas[doc_id])
                                    if all([f(t) for f in self.filters])])
                        sys = set([t for t in self.get_tagset(s_sas[doc_id])
                                   if all([f(t) for f in self.filters])])
                else:
                    if invert:
                        gold = set([t for t in self.get_tagset(g_sas[doc_id])
                                    if not any([f(t) for f in self.filters])])
                        sys = set([t for t in self.get_tagset(s_sas[doc_id])
                                   if not any([f(t) for f in self.filters])])
                    else:
                        gold = set([t for t in self.get_tagset(g_sas[doc_id])
                                    if any([f(t) for f in self.filters])])
                        sys = set([t for t in self.get_tagset(s_sas[doc_id])
                                   if any([f(t) for f in self.filters])])

            else:
                gold = set(self.get_tagset(g_sas[doc_id]))
                sys = set(self.get_tagset(s_sas[doc_id]))

            self.tp.append(gold.intersection(sys))
            self.fp.append(sys - gold)
            self.fn.append(gold - sys)
            self.doc_ids.append(doc_id)

    @staticmethod
    def recall(tp, fn):
        try:
            return len(tp) / float(len(fn) + len(tp))
        except ZeroDivisionError:
            return 0.0

    @staticmethod
    def precision(tp, fp):
        try:
            return len(tp) / float(len(fp) + len(tp))
        except ZeroDivisionError:
            return 0.0

    @staticmethod
    def F_beta(p, r, beta=1):
        try:
            return (1 + beta ** 2) * ((p * r) / (p + r))
        except ZeroDivisionError:
            return 0.0

    def macro_recall(self):
        arr = np.array([Evaluate.recall(tp, fn) for tp, fn in zip(self.tp, self.fn)])
        return (arr.mean(), arr.std())

    def macro_precision(self):
        arr = np.array([Evaluate.precision(tp, fp) for tp, fp in zip(self.tp, self.fp)])
        return (arr.mean(), arr.std())

    def micro_recall(self):
        try:
            return sum([len(t) for t in self.tp]) / \
                   float(sum([len(t) for t in self.tp]) +
                         sum([len(t) for t in self.fn]))
        except ZeroDivisionError:
            return 0.0

    def micro_precision(self):
        try:
            return sum([len(t) for t in self.tp]) / \
                   float(sum([len(t) for t in self.tp]) +
                         sum([len(t) for t in self.fp]))
        except ZeroDivisionError:
            return 0.0

    def _print_docs(self):
        for i, doc_id in enumerate(self.doc_ids):
            mp = Evaluate.precision(self.tp[i], self.fp[i])
            mr = Evaluate.recall(self.tp[i], self.fn[i])
            str_fmt = "{:<25}{:<15}{:<15}{:<20}"

            print((str_fmt.format(doc_id,
                                  "Precision", "",
                                  "{:.4}".format(mp))))

            print((str_fmt.format("[{}({}){}]".format(len(self.tp[i]) +
                                                      len(self.fn[i]),
                                                      len(self.tp[i]),
                                                      len(self.tp[i]) +
                                                      len(self.fp[i])),
                                  "Recall",
                                  "",
                                  "{:.4}".format(mr))))

            print((str_fmt.format("",
                                  "F1",
                                  "",
                                  "{:.4}".format(Evaluate.F_beta(mp, mr)))))

            print(("{:-<25}{:-<15}{:-<15}{:-<20}".format("", "", "", "")))

    def _print_summary(self):
        Mp, Mp_std = self.macro_precision()
        Mr, Mr_std = self.macro_recall()
        mp = self.micro_precision()
        mr = self.micro_recall()

        str_fmt = "{:<25}{:<15}{:<15}{:<20}"

        print((str_fmt.format(self.sys_id +
                              " ({})".format(len(self.doc_ids)),
                              "Measure", "Macro (SD)", "Micro (Primary)")))

        print(("{:-<25}{:-<15}{:-<15}{:-<20}".format("", "", "", "")))

        print((str_fmt.format("Total",
                              "Precision",
                              "{:.4} ({:.2})".format(Mp, Mp_std),
                              "{:.4}".format(mp))))

        print((str_fmt.format("",
                              "Recall",
                              "{:.4} ({:.2})".format(Mr, Mr_std),
                              "{:.4}".format(mr))))

        print((str_fmt.format("",
                              "F1",
                              "{:.4}".format(Evaluate.F_beta(Mp, Mr)),
                              "{:.4}".format(Evaluate.F_beta(mr, mp)))))
        print("\n")

    def print_docs(self):
        print(("Report for {}:".format(self.sys_id)))
        print(("{:<25}{:<15}{:<15}{:<20}".format("", "Measure", "", "Micro (Primary)")))
        print(("{:-<25}{:-<15}{:-<15}{:-<20}".format("", "", "", "")))
        self._print_docs()

    def print_report(self, verbose=False):
        self.verbose = verbose
        if verbose:
            self.print_docs()

        self._print_summary()

    def get_tagset(self, annotation):
        raise Exception("Must be implemented by Subclass!")

    def validate_text(self, gold_text, system_text, doc_id):
        assert gold_text == system_text, \
            "Annotation text for document {}.xml differs!".format(doc_id)


class EvaluatePHI(Evaluate):
    def get_tagset(self, annotation):
        return annotation.get_phi()


class EvaluateTokenizedPHI(Evaluate):
    def get_tagset(self, annotation):
        return [token for tag in annotation.get_phi()
                for token in PHITokenSequence(
                annotation.text[int(tag.start):int(tag.end)],
                tag,
                start=int(tag.start))]


class EvaluateCardiacRisk(Evaluate):
    def get_tagset(self, annotation):
        return annotation.get_doc_tags()

    def validate_text(self, gold_text, system_text, doc_id):
        pass


class CombinedEvaluation(object):
    """Base class for running multiple evaluations. This has a similar function
    signature to Evaluate and so can be used interchangably in the evaluate()
    function.
    """

    def __init__(self):
        self.evaluations = []

    def add_eval(self, e, label=""):
        e.sys_id = e.sys_id
        e.sys_id += " " + label if e.sys_id and e.sys_id != '' else label
        self.evaluations.append(e)

    def print_docs(self):
        for e in self.evaluations:
            e.print_docs()

    def print_report(self, verbose=False):
        for e in self.evaluations:
            e.print_report(verbose=verbose)


class CardiacRiskTrackEvaluation(CombinedEvaluation):

    def __init__(self, annotator_cas, gold_cas, **kwargs):
        super(CardiacRiskTrackEvaluation, self).__init__()
        # Basic Evaluation
        self.add_eval(EvaluateCardiacRisk(annotator_cas, gold_cas, **kwargs),
                      label="")


class PHITrackEvaluation(CombinedEvaluation):
    # list of Tuples of regular expressions for matching (TAG, TYPE)
    # That are considered to be HIPAA protected for the PHI Track evaluation
    HIPAA_regexes = [(re.compile("NAME"), re.compile("PATIENT")),
                     (re.compile("LOCATION"), re.compile("CITY")),
                     (re.compile("LOCATION"), re.compile("STREET")),
                     (re.compile("LOCATION"), re.compile("ZIP")),
                     (re.compile("LOCATION"), re.compile("ORGANIZATION")),
                     (re.compile("DATE"), re.compile(".*")),
                     (re.compile("CONTACT"), re.compile("PHONE")),
                     (re.compile("CONTACT"), re.compile("FAX")),
                     (re.compile("CONTACT"), re.compile("EMAIL")),
                     (re.compile("ID"), re.compile("SSN")),
                     (re.compile("ID"), re.compile("MEDICALRECORD")),
                     (re.compile("ID"), re.compile("HEALTHPLAN")),
                     (re.compile("ID"), re.compile("ACCOUNT")),
                     (re.compile("ID"), re.compile("LICENSE")),
                     (re.compile("ID"), re.compile("VEHICLE")),
                     (re.compile("ID"), re.compile("DEVICE")),
                     (re.compile("ID"), re.compile("BIOID")),
                     (re.compile("ID"), re.compile("IDNUM ")),
                     (re.compile("AGE"), re.compile(".*"))]

    def __init__(self, annotator_cas, gold_cas, **kwargs):

        super(PHITrackEvaluation, self).__init__()

        # Tokenized Evaluation
        self.add_eval(EvaluateTokenizedPHI(annotator_cas, gold_cas, **kwargs),
                      label="Token")

        # Basic Evaluation
        self.add_eval(EvaluatePHI(annotator_cas, gold_cas, **kwargs),
                      label="Strict")

        # Fuzzy Evaluation
        PHITag.fuzzy_end_equality(2)
        self.add_eval(EvaluatePHI(annotator_cas, gold_cas, **kwargs),
                      label="Relaxed")

        # Add HIPAA filter to evaluation arguments
        kwargs['filters'] = [PHITrackEvaluation.HIPAA_predicate_filter]

        # Tokenized Evaluation
        self.add_eval(EvaluateTokenizedPHI(annotator_cas, gold_cas, **kwargs),
                      label="HIPAA Token")

        # Change equality back to strict
        PHITag.strict_equality()
        self.add_eval(EvaluatePHI(annotator_cas, gold_cas, **kwargs),
                      label="HIPAA Strict")

        # Change equality to fuzzy end
        PHITag.fuzzy_end_equality(2)
        self.add_eval(EvaluatePHI(annotator_cas, gold_cas, **kwargs),
                      label="HIPAA Relaxed")

        # Change equality back to strict
        PHITag.strict_equality()

        # Remove HIPAA Filter for now
        del kwargs['filters']

        # New Request for Start-End only matching (could do
        # this as a context manager) but we'll just hack it here
        # Set key's to just start/end, 
        # import pudb; pu.db

        _PHI_keys = {}
        for k, cls in list(PHITag.tag_types.items()):
            if k != "PHI":
                _PHI_keys[k] = cls.key
                cls.key = ['start', 'end']

        # Big hack - PHIToken._get_key hardcodes what it returns
        # Thats what I get for trying to do it quick and dirty
        PHIToken._get_key = lambda s: (s.start, s.end)

        # Tokenized Evaluation
        self.add_eval(EvaluateTokenizedPHI(annotator_cas, gold_cas, **kwargs),
                      label="Binary Token")

        # Basic Evaluation
        self.add_eval(EvaluatePHI(annotator_cas, gold_cas, **kwargs),
                      label="Binary Strict")

        # Add HIPAA filter to evaluation arguments
        kwargs['filters'] = [PHITrackEvaluation.HIPAA_predicate_filter]

        # Tokenized Evaluation
        self.add_eval(EvaluateTokenizedPHI(annotator_cas, gold_cas, **kwargs),
                      label="Binary HIPAA Token")

        # Change equality back to strict
        PHITag.strict_equality()
        self.add_eval(EvaluatePHI(annotator_cas, gold_cas, **kwargs),
                      label="Binary HIPAA Strict")

        # Restore Class Keys
        for k, cls in list(PHITag.tag_types.items()):
            if k != "PHI":
                cls.key = _PHI_keys[k]

        # restore dirty dirty hardcoded PHIToken hack
        PHIToken._get_key = lambda s: (s.name, s.TYPE, s.start, s.end)

        for t in list(PHITag.tag_types.keys()):
            if t != "PHI":
                self.add_tag_name_specific_evaluations(t, annotator_cas, gold_cas, kwargs)

    def add_tag_name_specific_evaluations(self, name, annotator_cas, gold_cas, kwargs):
        kwargs['filters'] = [lambda tag: tag.name == name]
        # Tokenized Evaluation
        self.add_eval(EvaluateTokenizedPHI(annotator_cas, gold_cas, **kwargs),
                      label="{} Token".format(name))

        # Basic Evaluation
        self.add_eval(EvaluatePHI(annotator_cas, gold_cas, **kwargs),
                      label="{} Strict".format(name))

        # Add HIPAA filter to evaluation arguments
        kwargs['filters'].extend([PHITrackEvaluation.HIPAA_predicate_filter])

        # Make sure the tag has the name passed in as 'name'  AND passes HIPAA_predicate_filter
        kwargs['conjunctive'] = True

        # Tokenized Evaluation
        self.add_eval(EvaluateTokenizedPHI(annotator_cas, gold_cas, **kwargs),
                      label="{} HIPAA Token".format(name))

        # Change equality back to strict
        PHITag.strict_equality()
        self.add_eval(EvaluatePHI(annotator_cas, gold_cas, **kwargs),
                      label="{} HIPAA Strict".format(name))

    @staticmethod
    def HIPAA_predicate_filter(tag):
        return any([n_re.match(tag.name) and t_re.match(tag.TYPE)
                    for n_re, t_re in PHITrackEvaluation.HIPAA_regexes])