IBM Support

K-Meansモデルの[クラスタの品質]について

Question & Answer


Question

K-Meansモデルをブラウズすると、[モデル]タブの[モデル集計]ビューにクラスタの品質]が表示されます。そこに[Cohesionと区切りのシルエット指標]として[悪い]、[普通]、[良い]と表示されています。この[悪い]、[普通]、[良い]はどのように解釈できますか。

Answer

[モデル集計] ビューには、陰影を付けて悪い結果、普通の結果、よい結果を示すクラスタ結合および独立のシルエット平均など、クラスタ モデルについてのスナップショットまたは要約が表示されます。このスナップショットを使用して、品質が悪いかどうかをすばやく確認できます。この場合、モデル作成ノードに戻ってクラスタ モデルの設定を修正し、よりよい結果を生成することができます。

悪い結果、普通の結果、よい結果は、クラスタ構造の解釈に関する Kaufman と Rousseeuw (1990) の研究に基づきます。[モデルの要約] ビューで、よい結果は Kaufman と Rousseeuw の評価をクラスタ構造の合理的または強力な証拠として反映、普通の結果は弱い証拠の評価を、悪い結果は、重要な証拠のない評価を反映するデータとなりま す。

すべてのレコードに対するシルエット平均は (B−A) / max(A,B) となります。A はクラスタ中心へのレコードの距離、B はレコードが属さない最近隣クラスタ中心へのレコードの距離です。シルエット係数 1 は、すべてのケースはクラスタ中心に直接配置されているということを意味します。値 −1 は、すべてのケースが他のクラスタのクラスタ中心にあることを意味します。平均の 0 の値は、ケースが自身のクラスタ中心と、その他の最近隣クラスタとの間で等距離にあることを意味します。

[{"Business Unit":{"code":"BU059","label":"IBM Software w\/o TPS"},"Product":{"code":"SS3RA7","label":"IBM SPSS Modeler"},"Component":"Modeler","Platform":[{"code":"PF025","label":"Platform Independent"}],"Version":"Not Applicable","Edition":"","Line of Business":{"code":"LOB10","label":"Data and AI"}}]

Document Information

Modified date:
07 October 2019

UID

swg21572466