Named entity recognition (NER)
This system is designed to determine the type of proper names, event names, products, place names and so forth.
The classification into three types:
Named types are not defined by the dictionary, and based on statistical algorithms.
Number and description of types of classes given at the stage of training (getting statistical model).
The accuracy of the types of entities (as F1):
This system works with the english text and classifies words containing uppercase letter.
The classification into three types:
- 1. Individuals (name or any component name, for example, Ted Bundy)
- 2. The legal entity (company names, companies, parties and the like, for example, UPS Law School, Central Washington University)
- 3. Geographical names (cities, states, and the like, for example, Vermont, Washington)
Named types are not defined by the dictionary, and based on statistical algorithms.
Number and description of types of classes given at the stage of training (getting statistical model).
The accuracy of the types of entities (as F1):
- 1. individuals - about 94%
- 2. legal entities - about 91%
- 3. geographical names - 95%
This system works with the english text and classifies words containing uppercase letter.
Автоматическое определение именованных сущностей (NER - Named-Entity Recognition)
Данная система предназначен для определения типа имен собственных, названий событий, продуктов, топонимов и пр.
Классификация производится на три типа:
Именованные типы определяются не словарем, а на основе статистических алгоритмов.
Количество типов и описание их классов задается на этапе обучения (получения статистической модели).
Точность определения типов сущностей (по мере F1):
Данная система работает с англоязычными текстами и классифицирует слова, содержащие заглавную букву.
Классификация производится на три типа:
- 1. физические лица (ФИО или любая составляющая ФИО, например, Ted Bundy)
- 2. юридически лица (названия компаний, обществ, партий и т.п., например, UPS Law School, Central Washington University)
- 3. географические названия (города, штаты и т.п., например, Vermont, Washington)
Именованные типы определяются не словарем, а на основе статистических алгоритмов.
Количество типов и описание их классов задается на этапе обучения (получения статистической модели).
Точность определения типов сущностей (по мере F1):
- 1. физические лица - около 94%
- 2. юридически лица - около 91%
- 3. географические названия - 95%
Данная система работает с англоязычными текстами и классифицирует слова, содержащие заглавную букву.