こんにちは、樋口です。
先の投稿では、Rのbiplot()関数については触れませんでしたので、少しだけ 補足しておきます。
この投稿に添付したファイルでは、上のNo.1923でも出てきた「(2)標準化スコ ア×固有値の平方根」のプロットと、biplot()関数を比べています。
ちなみに、もとのデータはチュートリアルでも使っている漱石の「こころ」で す。赤の四角形は「上」「中」「下」といった変数の位置を、グリーンのドッ トは語の位置をあらわしています。
■biplot関数(デフォルト)の特徴
添付画像を見ると、biplot()関数では、変数は変数で枠いっぱいに広げ、語は 語で枠いっぱいに広げていることが分かるでしょう。変数(行スコア)と語( 列スコア)とで、図形としての扱い(拡大率)を変えて、それぞれを枠いっぱ いに広げているのです。(※したがって、これはもう「対称的なプロット」と は言えないように思います)
上のNo.1923に出てきた(1)〜(3)までに関しては、プロットを全体として縦横 に引き延ばすというだけの違いでした。それに対してbiplot()では、変数と語 との、相対的な位置関係まで変化していることがわかるでしょう。
■メリット・デメリット
変数と語とを別々に枠いっぱいに広げることで、スペースを有効に利用できる 可能性が高まるように思います。一方で、伝統的に多用されてきた(2)と比べ ると、けっこう印象が変わることもあってか、このbiplotの方式をよしとしな い方もいらっしゃるようです。
ただ、原点からの方向と距離を見るという、上のNo.1926で述べた正しい解釈 のしかたであれば、(2)からでも(4)からでも、まったく同じ分析結果を読み取 ることができるはずです。
■まとめ
正しい解釈のしかたならば同じ結果を読み取れますから、個人的にはbiplot() の方式に問題があるとは考えていません。ただ、以前から多用されてきた方式 とは異なることを知っておいても良いかもしれません。
ということで、いくつかのプロット方式がありますが、正しい解釈のしかたさ え知っていれば、実用上はあまり気にしなくてよいように思っています。
|