図書館の統計
図書館では、たくさんの統計データを扱う機会があります。統計学的な手法を使ってデータを処理したいと思っている人も多いでしょう。
しかし、なんだか統計学は難しそうと思われるのか、図書館の現場では統計学を使ったデータ分析を見かけることはほとんどないように思います。
その理由は、おそらく難しい数学を扱うというイメージがあるからかもしれません。しかし、実際のところ、図書館で統計学的な手法を使ってデータを分析するのは、そんなに難しいことではないんです。
「やさしい統計学」などの入門書もたくさんありますが、統計ユーザーである図書館員として大切なのは、統計学を勉強するというより、さまざまな統計学的な手法をどう使うか、つまり「使い方」を理解するだけでまずは十分であると認識することだと感じます。
数学的な理論の理解から始めるよりも、まずはデータをどういう方法・手段で分析するのかを知り、様々なツールを利用することから始めるのがいいでしょう。それが、データから欲しい情報を得るための一番の近道です。
いろいろな方法を利用しているうちに、統計学に興味を持って、専門の本を読んでみたくなるかもしれません。そのときは、ぜひ手に取ってみてください。そして、意外にも統計学の内容がスムーズに理解できることに気付くはずです。
分布の状態を調べる
統計分析を始める際の第一歩は、データの分布状態を調べることです。
これを行う方法として、一般的にはグラフを使います。さまざまな種類のグラフがあり、棒グラフや帯グラフ、ヒストグラム、箱ひげ図、散布図などがあります。
たとえば、2つのデータの平均値が同じでも、箱ひげ図を見ることで実際のばらつきに大きな違いがあることに気付くことがあります。グラフを使ってデータの特徴を観察することで、より分かりやすく情報を得ることができます。
満足度の評価
図書館では、利用者のみなさんがどれだけ満足しているかを知るために、アンケートを実施することがあります。その満足度の結果を、過去と比べてどのように判断するか、考えてみましょう。
たとえば、次のような過去3年間の図書館利用者のアンケート結果から、「蔵書の満足度」について調べてみることにします。
これを集計すると次のようになります。
蔵書の満足度を評価する方法として、よく使われるのは「とても満足」と「まあ満足」を足して、その割合を見て判断するという方法です。
上のデータを計算すると、次のとおり年ごとに満足の割合が上昇しているようですね。
また、次のように帯グラフを描いて判断します。このグラフを見ると、満足の割合が次第に増えてきていることが一目で分かります。
ここまでの情報をもとに、皆さんの図書館では「蔵書の満足度」をどのように自己評価するでしょうか。
「年々満足度が上がっており、地域の人々のニーズにしっかりと応えてきた取り組みが評価された。」と報告しても、多くの人は納得してくれるでしょう。
しかし、もしかしたら偶然ではないか、誤差の範囲内ではないかと疑問を持つ人もいるかもしれません。そこで、次の図のように「グラフ要素」を使って誤差の範囲を確認してみます。
【拡大図】
詳しく見てみると、拡大図ではR4とR5の誤差範囲が一部重なっていて、R5の数字が上回ったのはたまたまか、誤差の範囲内である可能性があります。
一方で、R3とR5の誤差範囲は重なっていません。したがって、R3からR5への変化は間違いなく満足度が向上していると言えるでしょう。
次回は、Excelの「データ分析」機能を使ってみましょう。