図書館の現場において統計学を語るのは場違いであると思っている人がいる一方で、逆に図書館運営に統計学を活かせないかと考えている人がいるのもまた実際のところです。
図書館は一般に文系の人の職場と思われていますが、文系の中には社会学や心理学など統計処理が必要な分野もあり、そういう分野を学んできた人は統計処理を図書館に活かせないかと思っていたりします。
そういう分野の文系の人でなくても統計処理の利用価値について直感的に気付いている人もいます。
しかし、分析ソフトウェアやPC機材の予算獲得、業務上の時間的制約により、統計処理を具体化するためにはどうしたら良いのかいろいろと迷い悩んでいるのが実情ではないでしょうか。
ばらつき
統計学はまず自然科学に、その次には心理学に取り入れられています。
心理学は科学としての学問となるべくいち早く統計処理による解釈に取り組んできた歴史があります。
日本では、1960年代以降特に製造業において品質管理に使われ、経済の高度成長を支えてきました。その所為か統計学と言えば品質に関わる学問として思い浮かべる人も多いかも知れません。
実際、統計学の基礎編・入門編となる本のほとんどが、正規分布を念頭に置いた説明から始まっており、製造された製品のある集団の精度のばらつき具合に注目して、母集団、標本、平均、偏差、偏差平方和、分散、標準偏差、標準誤差、確率分布、検定など、集団を統計的に推測して製品品質の把握・向上を図ることができる処理体系の説明になっています。
要因
一方、図書館における関心事は集団のばらつき具合よりも、30代はどういう本に関心があるか、60代はどうかなど、年代と本のような要因間の関係性がどうなっているかにあります(相関分析)。
あるいは、満足度に顕著な影響を与えている要因は何かを知りたいというところにあります(重回帰分析)。
原因と結果を明らかにしたいと言っても良いでしょう。
様々な要因が存在する場合の分析は、統計学では多変量解析に属するもので、統計学の入門編では最後に触れられるか、場合によってはまったく扱われない項目になっています。
関心事を先に
恐らく、図書館の現場では入門から始めて多変量解析に辿り着く順を踏む必要はなく、まず図書館での関心事である、相関分析と重回帰分析の2つから直接取り組むことをお勧めしたいと思います。
先の投稿で述べてきたように、相関分析と重回帰分析はExcelで容易に処理結果を得ることができますので、結果の読み方、解釈の仕方に注力するだけで便利な分析ツールとして直ちに使えるのです。
多変量解析はもちろん統計学の基礎があって成り立つものですが、図書館の現場としては現実的にはツールが使えればまずは良いのではないかという考えです。
分析ツールを使い慣れてきて統計学の基礎が気になってきたら、その時に初めて遡って勉強すればいいのではないでしょうか。その方が知りたい意欲が強い分、理解も早いと思います。
基礎から読み始める必要がない理由
基礎的な知識なしにツールを使うのは邪道と言われるかもしれません。
しかし、皆さんは日常ではすでにそういうことをしています。
電子機器のCPUは命令を一つずつ逐次実行していくノイマン型のマシン(機構)です。にもかかわらず、同時に複数のタスクを実行しているように見えるのはどういうことなのか。
CPUの動作原理やOSの仕組みを知らなくても、皆さんはスマホで複数のアプリを立ち上げて使っています。
そしてアプリの使い方がわかれば良いのです。
同じことです。
コンピュータの動作原理を知らなくても、ツールは使えるということです。
動作原理に興味があればその時に掘り下げれば良い話です。興味があればこそ、勉強して理解に努めることができるというものです。
原理から順に勉強を始めるよりも、関心事を先にやってみることから始めるのが吉ということもあるのです。
踏ん張りどころ
分析ツールを利用するにあたっては、実は大きな障壁があることを伝える必要がありました。
その障壁とは、情報を分析ツール用のデータ形式にしつらえる作業のことです。
この作業を誰がやるか、いつやるかが問題なのです。
質的データである満足、まあ満足などを数値化する、徒歩、自転車、車などの選択肢をダミー変数に変換する、などの作業が必要なのです。
この作業ができるかどうかが、図書館の現場でデータ分析をやってみるかどうかの非常に大きな分かれ目になっています。
データが出来上がれば、分析そのものはツールが簡単に実行してくれるのですが、この障壁の前でほとんどの図書館員が立ち止まってしまうのです。
以前の投稿で質データの変換処理について説明をしていますので、図書館アンケートをデータ分析すると有益な情報が得られるのではないかと考えている人は、是非自らこの障壁に挑んで欲しいと思います。