こんにちは、樋口です。書き込みありがとうございます。
また、質問の仕方についても、ご配慮いただき感謝申し上げます。格段にお答 えしやすくなりました。(理解せずに質問することはあまり問題ではありませ ん。ただ、どのように理解を試みて、どこまで理解できているかを、できるだ け詳しくお書きいただきたいのです)
> ・知りたかった点 > 参照した書籍には、(2)の表示について > 「この布置を対象解と呼ぶ。ただし、この工夫は、布置を『見やすく』はす > るが、解の表示としてはふさわしくないとする議論もある」 > とだけ書いてありました。 > ※Rのbiplotの関数を使用した際の解説 > > この「ふさわしくない」とする理由(議論)を探しておりました。
■誤解を誘いかねない点
例によってどんな「議論」のことか確信を持てませんが、ここは大胆に(無謀 に?)樋口の考えを書こうと思います。
先の投稿(No.1923)で示した(1)〜(3)のすべてに当てはまることですが、語 と変数(または見出し)との距離が「近い」「遠い」と解釈することは数学的 には正しくありません。語と語、変数と変数なら「近い」「遠い」と言える/ 言いやすいのですが、語と変数はダメです。語と変数とは、厳密には、同じ尺 度上にあるとは言えないためです。したがって、布置された場所が近いかどう かではなく、原点からの方向や距離にもとづいて解釈するのが正しい方法とな ります。
例えば、漱石『こころ』チュートリアルの対応分析をご覧下さい。このスライ ドの21枚目です。(当該の1枚を画像としてこの投稿に添付しています) http://www.slideshare.net/khcoder/kh-coder-28776074
この図の左上の方に「上_先生と私」という見出しがあり、「先生」という語 があります。ここから「上_先生と私」には「先生」という語が特徴的に(特 に多く)出現していたことが分かります。ただし、解釈のしかた、書き方とし ては、「布置された場所が近いかどうか」ではなく「原点からの方向や距離」 に注目するのが正しいのです。
> ×「上」の近くに「先生」があるので、「先生」は「上」に特徴的 > > ○原点から見て「上」の方向、それも原点から大きく離れた位置にあるので、 > 「先生」は「上」に特徴的
この「○」の解釈ならよいのですが、「×」の方は数学的には正しくないので す。近いか遠いかを見るなら、「持つ」だって「先生」と同じくらい「上」に 近い(ように見える)わけですが、原点から離れている「先生」の方が、「上」 に特徴的なのです。
この「×」の解釈のような、言わば誤解を誘いかねないという理由で、「ふさ わしくない」云々の議論があるものと私は考えています。
■ではどうするのか
1つは、「上」「中」「下」のような変数だけのプロットと、「先生」「持つ」 のような語だけのプロットの2枚に分けるという方法があります。※ただ、誤 解を避けるためだけにわざわざ余分にスペースをとるのかという気もします。
また、先の投稿(No.1923)で示した(1)〜(3)はすべて、変数にも語にも(行 スコアにも列スコアにも)同じ操作を加えるという点で、「対称的」なプロッ トです。それに対して、別々の操作を加えるような非対称的なプロットを作る ことで、この問題に対処するという考え方もあるようです。※これを行なうと、 語か変数のどちらかが原点付近に集まってしまい、読み取りにくくなります。
上記いずれの方法も完全な解決法とは言えませんし、結局は、これまでも多用 されてきた対称的なプロットで良いのではないかということです(少なくとも デフォルトで利用するプロットとしては)(Greenacre 2007: 267, http://amzn.to/1s0Fu3v )。ですから、上記の「×」ではなく「○」の解釈 をするようにさえ注意すれば、安心して対称的なプロットをお使いいただける でしょう。
■おことわり
ずいぶん前ですが、統計数理研究所の名誉教授でいらっしゃる大隅昇先生に、 対応分析について教えていただいたことがあります。そのご恩を世の中に還元 せねばというような気持ちもあって、今回はお答えさせていただきました。
ただ今後、統計についてなんだって答えるか/答えられるかというと、そうも いかないと思います。あらかじめご了承下さい。また、私の記述に誤りがあっ たとすれば、それはすべて私一人の責任によるものです。
|