フィールドサイエンスの拠点
各教員が選択したキーワードを教員どうしで比べたとき、どれだけ同じキーワードが共通して含まれているかで、教員の類似度を表わすとします。類似度が高ければ、つまり共通のキーワードが多ければ多いほど教員の研究分野は近いといえます。この類似度を距離に換算し、各教員を二次元の地図上にプロットするのが、多次元尺度構成法(Multi Dimentional Scaling:MDS)と呼ばれるデータ解析手法です。この方法を使うと、似ている似ていないという情報が視覚化でき、全体の傾向が把握し易くなります。
教員を行、キーワードを列とした表を作ります。各教員が選択したキーワードのマス目(セル)には1を入力します。選択しなかったセルには0を入力します。
こうして各教員ごとに0と1の並んだ数字の組ができあがります。
この数字の組を多次元空間での座標と考えます。もしキーワードが3つだけなら、例えば(1, 0, 0)なら、x座標が1で、y座標とz座標が0の点を表わしていることになります。
次に各点どうしの距離を総当たりで計算します。
この距離はあくまで多次元空間での距離ですので、これを2次元平面の地図に落とし込みます(次元の縮約)。このとき、多次元空間での距離関係をなるべく保ったままで、地図上にプロットするようにします。
実際の計算には統計計算パッケージRを用い、距離の計算はdist関数、次元の縮約はcmdscale関数を使用しました。
参考文献 Rと多次元尺度法