Классификация объектов (любые процессы, предметы и т.д.) - группировка и выделение классов, характеризующих общими (однородными) свойствами. Распределение по классам в соответствии с определенным признаком. Свойства информационного объекта определяются информационными параметрами - реквизитами (числовые данные, либо признаки).
Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта.
Классификатор - систематизированный свод наименований и кодов классификационных группировок.
Признак классификации является основанием для деления на классы (пол, возраст и т.п.). Логическим продолжением будет являться задача кластеризации (автоматической классификации). При кластеризации перечень классов и их характеристики определяют в процессе работы алгоритма.
Методы классификации объектов:
Иерархический (деление от нулевого уровня в зависимости от классификационного признака на 1 уровень и т.д. в виде дерева. Необходимо заранее определить цель - выяснить свойства (в дальнейшем признаки классификации), которыми должны обладать объединяемые в классы объекты. Количество уровней характеризует глубину классификации. Например, факультет - название факультетов - возраст студентов - пол студентов;
Фасетный - выбор признаков независимо от семантического содержания и друг от друга. Признаки называют фасетами (facet - рамка). Каждый фасет содержит совокупность однородных значений классификационного признака. Например, фасет специальность или цвет. Значения в различных фасетах не должны повторятся. Классификация производится при помощи присвоения каждому объекту соответствующих фасетных значений.
Дескрипторный - описательная система классификации, язык которой приближен к естественному языку описания информационных объектов. Используется для организации поиска информации и ведения тезаурусов (словарей). Широко применяется в библиотечной системе поиска. Отбирают совокупность ключевых слов или словосочетаний, описывающую предметную область или совокупность однородных объектов. Далее ключи подвергают нормализации (из совокупности синонимов выбирается один или несколько наиболее употребимых). Создается словарь дескрипторов (ключей, отобранных в результате нормализации). Например, ключи: оценка, экзамен, зачет, преподаватель, студент и т.д. Между дескрипторами устанавливают связи:
- синонимические - указывают некоторую совокупность ключей как синонимов. Например, студент - учащийся - обучаемый;
- родо-видовые - отражают включение класса объектов в более представительный. Например, университет - факультет - кафедра;
- ассоциативные - соединяют дескрипторы, обладающие общими свойствами. Например, студент - экзамен - профессор - аудитория.