Функционалы качества разбиения

Существует много способов разбиения на классы заданной совокупности элементов. Возникает задача сравнительного анализа качества этих способов разбиения. С этой целью вводится понятие функционала качества разбиения , определенного на множестве всех возможных разбиений. Наилучшее разбиение представляет собой такое разбиение, при котором достигается экстремум выбранного функционала качества. Выбор того или иного функционала качества разбиения, как правило, опирается на эмпирические соображения.

Рассмотрим некоторые наиболее распространенные функционалы качества разбиения. Пусть при исследовании выбрана метрика ρ в пространстве Х и некоторое фиксированное разбиение наблюдений на заданное число ρ классов .

Существуют следующие характеристики функционала качества

· сумма внутриклассовых дисперсий

;

· сумма попарных внутриклассовых расстояний между элементами

.

и широко используются в задачах кластерного анализа для сравнения качества процедур разбиения;

· обобщенная внутриклассовая дисперсия

,

где detA – определитель матрицы А;

Cl – выборочная ковариационная матрица класса Sl, элементы которой определяется по формуле

, ,

где - q – я компонента многомерного наблюдения ;

- среднее значение q – й компоненты, вычисленное по наблюдениям l – го класса.

Качество разбиения характеризуют и другим видом обобщенной дисперсии, в которой операция суммирования Cl заменена операцией умножения

.

Функционалы и обычно используют при решении вопроса: не сосредоточены ли наблюдения, разбитые на классы, в пространстве размерности, меньшей, чем k.


0439732474552339.html
0439797506586606.html
    PR.RU™