迷走ブログ

ファウスト的衝動を抱き、迷走している、凡人による気まぐれブログです。

【新卒】数字の苦手な人がなんちゃって統計資料の作成をしたときに気をつけたこと

はじめに

f:id:yktmmrmtoosa03:20210906130020j:image

僕は入社して間もない時「アンケート調査と結果をまとめてほしい」と言われました。

別の業務も抱えており、突然言われたため困惑したことを覚えています(笑)。

その時を振り返り、つまずいた経験と気をつけたことを共有できればと思います。

もしも、同じように困った経験をしている人がいれば、参考にしていただければ幸いです。

【重要】納期期日を確認すること

f:id:yktmmrmtoosa03:20210906130236j:image

出だしからレベルの低いことを書いており、申し訳ないです。

とりあえず、上司から「これやっておいてー」と軽い口調で言われたら、即座に「いつまでに終わらせる必要があるのか」を聞くことをおすすめします。

そうでないと、自分の別の業務との兼ね合いもあるため、いつまで経っても取り掛かることができません。通常であれば、そもそも仕事を割り振る方が、期日を設けてくれることが多いと思います。

そのため、仕事を割り振られる側は締め切り通り終えることができるか否かをその場で(或いはスケジュールを確認次第)お答えすれば良いのですが、僕の場合、入社してすぐのころでもあり一杯一杯となり、締切を把握するという点を失念していました(この時は急ぎではなさそうだし、1ヶ月後でいいか、と先延ばしにしてしまった)。案の定、2週間くらいして「終わった?」と聞かれてしまったことがありました。

そのようなミスをして以降、常に締め切りを聞くようにしています。

自分への戒めとして、初めに書きました。

 

【重要】何のために資料を作成しているのかを把握すること

f:id:yktmmrmtoosa03:20210906131626j:image

当たり前かもしれませんが、到着点を把握しないと、どのようにまとめれば良いのかわかりません。

そのため任されたはいいのだけれども「一体全体、何のための資料作りなのか」わからなければ、即座に聞くことをお勧めします。

「アンケート調査をしたから、それをまとめてほしい」という漠然とした内容だったとしても、一度引き受けてしまったからには投げ出してしまってはいけません(笑)。まずは「何のためのアンケート調査だったのか」を質問する、アンケート設計表を確認する等、当たり前のことをしっかりと把握することをお勧めします。

次に、上記のような情報が一切発見できない、把握する時間がない場合です。

例えば、「いい感じにまとめておいてー」と言われた場合、仕事を割り振った方もよく把握していない可能性が考えられます。

その場合は、文句を言っても仕方ないので、とりあえず「企業のビジョン」、「中期経営計画の目標」、「部内の目標」へと貢献する(つながる)ということを漠然と意識して、作業に取り掛かるしかありません(笑)。というよりも、おそらくまとめる時も上記と絡めることになるので、一度は確認しておくことをお勧めします。

 

結果をまとめ終える前に(上司に)相談すること

f:id:yktmmrmtoosa03:20210906131724j:image

僕の場合ですが、分析したら即座に結果をパワポやエクセルにまとめる、ということは避けるようにしています。

なぜならば、できるかぎり「上司が思い描くアウトプットと自分の思い描くアウトプットのすり合わせ」を行うべきであると考えるからです。そのため、一度「こういう方向性で行こうと思う」ということをまとめる前に相談するようにしています。

そのようにすることで、「ポジティブフィードバック」「ネガティブフィードバック」どちらに重きをおいてまとめるべきなのか、等のまとめ方の方向性を固めることができます。また困るのは、何度もまとめ直すことで、双方無駄な修正作業が増えてしまうことです。

加えて、発表者(例えば上司)と「分析者」の間で明確な認識相違があることで、面倒な打ち合わせ(認識のすり合わせ)を焦って「発表直前」に行わなければならないことだと思います。

上記のような面倒事を避けるためには、情報の共有(進捗具合の報告)という意味合いも兼ねて、未然防止策として報告する時間を少しでも設けることをお勧めします。

 

データの種類を把握しておくこと

ここでお伝えしたいのは、データをまとめるときにデータの種類を認識することです。

例えば、アンケート回答者のAさんの「郵便番号」とBさんの「郵便番号」をそれぞれ合計した値を出して、それぞれの合計値のどちらが「大きかった」「小さかった」と比較してもあまり意味がないことだと思います。

上記の例は極端な例ですが、分析項目について、定性的データなのか、定量的データなのかと言ったことを把握していないと間違った方向性に向かってしまう可能性があります。そのため、最低限、データの種類についてはなんとなくでも良いので、把握しておくことをお勧めします。

f:id:yktmmrmtoosa03:20210906115934j:image

総務省統計局が提供しているサイトがあるので、そこでざっと確認しておくだけでも意味があると思います。簡潔にデータの種類が列挙されているので整理するのに参考になります。他にも基本的なことがわかりやすくまとめられており、お勧めです。

総務省統計局:データ・データセットの種類

書籍ですと、堅苦しいものになってしまいますが、僕が読んでためになったと感じたのは、以下のものです。

pythonの勉強も兼ねて、統計学を知りたかったのでざっと読みました。使いこなせていないのでまだまだですが、読むだけでも意味があると思います。

 

グラフの見せ方に気をつけること

上述のデータの種類とも関係するのですが、やたらめったら棒グラフだけでしか表現しない、と言ったことは避けるべきです(笑)。

お恥ずかしながら僕はグラフの使い方を理解できていなかったので、棒グラフと円グラフをなんとなく使い分けていました。

他にも例えば、円グラフは、「12時のところ」から「値を大きい順に右回りに配置する」ことや量の大小の関係を表す場合には棒グラフがわかりやすい等の可視化する際の注意事項(わかりやすく表現するコツ)みたいなものを意識することをお勧めします。

加えて、グラフ内に余計な情報を入れないことです。

例えばエクセルで集計する場合、ピボットテーブルを使うとインデックスとカラムの名前がそのまま反映されたりして、ごちゃごちゃした表現(具体的には「個数/〇〇」と言った文言)が入ります。そのような無駄な文言を非表示にする、文言を編集するなど工夫する必要があります。

サイトでは、上述の通り総務省統計局が提供しているものがお勧めです。

総務省統計局:グラフの種類

書籍で参考になったのは、以下のものとなります。pythonを使って、どう表現するのか簡潔にまとめられているのですが、それ以前に「データビュアライゼーション」とは何かについて、わかりやすくまとめられています。お勧めです。

 

意見と事実を分け、伝わるようにすること

これはすでに身につけていらっしゃる方が多いと思いますが、「誰の意見」や「誰の解釈」なのか、「事実」なのかを第三者にわかるように表現することです。

スライドに直接「分析者の意見・解釈」等書いても良いと思いますし、発表時に注意事項としてお伝えするという方法でも良いと思います。

いずれにしても、第三者に伝える(伝わる)ことが大切なので、そこら辺を失念しないことをお勧めします。

要は脈絡もなく自分勝手にデータを解釈しているわけではないことをアピールできれば、細かいことは問われないと思います。。。

 

基本統計量について確認すること

データの中心位置を示す尺度は、平均値やメディアンなどがあります。

またばらつきを表す尺度としては、(偏差)平方和、分散、標準偏差、範囲などが挙げられます。

特に、データのばらつきを表示するためには、上記の意味は多少なりとも理解しておくことをお勧めします。

(そうでないと、どういう意味の数値なの?と突っ込まれた時に回答に困ることになりますので。。。)

統計学をざっと把握するのにお勧めな書籍は、マンガでわかるシリーズが個人的にわかりやすいと思います。

 

おわりに

今回は、僕自身の経験を元に、簡易的な統計分析時の注意事項を共有させてもらいました。

どなたかの参考になれば幸いです。