2009-01-15

分かれるとまとまる

会社の同僚たちは、クラスター分析のデンドログラムを、データがまとまっていく様子ではなく、分かれていく様子として理解しています。

だから、クラスター分析の結果を解釈する場合、

「あーーー、この2つのデータは、最後に分かれたから、すごく似てるんだねえ」

ってコトになります。
でも、本当は、最初にくっついたから、似てるんですけどねえ。

まあ、上手にデータ解釈ができれば、どっちでもいいです。がしかし、計算アルゴリズムを知ってる人からは、「こいつわかってねえ」と、馬鹿にされそうな感じです。

ただし、物が分かれていく事と、まとまる事の本質的な違いは、僕もよく分かりません。初期の状況をまとまっていると考えるか、バラバラと考えるかが、見かけ上の違いです。が、初期がバラバラでも、結果としてまとまるのであれば、それは、気が付かないだけで、そもそもまとまっていたとも考えられなくもない気がします。

なんだか、わけが分からなくなってきました。この辺は、主成分分析と因子分析の違いと似ている気がしますね。

この辺は、哲学者と数学者にお任せするしかないのかもしれない、そんな気がした木曜の夜。

0 件のコメント:

コメントを投稿