データ分析を行うための前処理

 図書館アンケートの分析では、結果のデータを分析ツールで処理できる形にする必要があります。特に名義尺度、順序尺度の質的データの場合は、分析ツールにとって意味のある情報となるようにダミー変数へ変換する処理を行います。

名義尺度

 下記のような名義尺度のデータは、数値化してさらにダミー変数に変換します。

    

アンケート結果が次のとおりだったとすると、まず選択肢の番号を使って数値化します。無回答の場合は、数値のゼロにしておきます。時には無回答を分析する場合もあります。

    

   

数値をさらにダミー変数に変換していきます。赤い数字で1になっている箇所です。

   

複数選択可の場合

 複数選択可の場合も同様にダミー変数に変換します。複数選択可では回答数を無制限にして、ニーズの切り捨てを行わないようにします。

  

   

数値をさらにダミー変数に変換していきます。赤い数字で1になっている箇所です。

  

順序尺度

 満足度のように評価の程度に差をつける順序尺度では、1~5のような値に変換して得点化することで大小関係の判断ができるようになります。ここでは、値が大きいほど評価が高いということになります。無回答は数値ゼロにしておきます。

  

   
 順序尺度においても同様に得点をダミー変数に変換しておくと、より詳しい分析を行うことができます。

  

データ分析のための前処理

 図書館アンケートの質問では、主に名義尺度や順序尺度が使われます。これらの情報を分析ツールで使えるようにするためには事前にダミー変数へ変換しておくなどの処理が必要であり、この前処理がデータ分析を行う上でもっとも多くの時間を要する作業と言って良いでしょう。前処理はExcel関数を駆使して効率的に行いたいところです。なお、アンケート・ツールによっては、自動的にダミー変数まで生成してくれるものもあります。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です