Сеть Кохонена. Кластеризация

Теория кластеризации дана на примере пяти образцов, которые надо распределить по трем кластерам. Первоначально кластеры (векторы с четырьмя координатами) берутся произвольно - случайно. Векторы X_k (четыре независимых свойства у каждого, т.е. 4 координаты) заданы. Оценивается близость векторов и кластеров. Если вектор с номером k оказывается ближе всего к кластеру W_i, то этот кластер подвигается к вектору- образцу по формуле W_i'=W_i+eta (X_i-W_i), где eta - коэффициент обучения (от 0 до 1). Процесс описан для одного цикла, но таких циклов должно быть много - до установившейся картины кластеров. Показывается, как ввести штрафные санкции на кластера-победителя, чтобы дать шанс другим кластерам. The clustering theory is based on the example of five samples that need to be distributed across three clusters. Initially, clusters (vectors with four coordinates) are taken randomly. The X_k vectors (four independent properties for each, i.e. 4 coordinates) are set. The proximity of vectors and clusters is estimated. If the vector with the number k is closest to the cluster W_i, then this cluster moves to the sample vector by the formula W_i'=W_i+eta (X_i-W_i), where eta is the learning coefficient (from 0 to 1). The process is described for a single cycle, but there should be many such cycles - until the cluster pattern is established. Shows how to impose penalties on the winning cluster to give other clusters a chance.

Смотрите также