「データや情報といった単語を曖昧に使い分けている」
「なぜデータ解析が重要か知りたい」
「計量値や計数値は何となく聞いたことある程度」
このような方に向けた記事です。10分で理解できるよう、わかりやすく簡潔に解説します。
データの取り扱いは、品質管理の業務に欠かせませんので、ぜひ基礎から理解を深めるのに、参考にしていただければと思います。
データとは何か?
改めて聞かれると説明できないなぁ
データ
物事の推論の基礎となる事実。
引用元:デジタル大辞泉(小学館)
品質管理を行う上で、事実に基づく客観的な判断が必要になり、「データ」は、そのもっとも基礎的な部分にあたります。
以下に例を示します。
・工場Aの今期の売上高は100万円だった。
これらは記録・事実であり、そして誰もが同じ解釈ができる客観的な内容です。
統計
集団における個々の要素の分布を調べ、その集団の傾向・性質などを数量的に統一的に明らかにすること。
引用元:広辞苑
「統計」は、「データ」を加工して得られます。
以下に例を示します。
・工場A、B、Cの売上高の平均値は、100万円であった。
なぜ統計を使う必要があるかというと、統計量を求めることで、その集団にどのような特徴があり、どういった性質を持つものか数量的に把握できるからです。
単にデータを取得しただけでは、そこから得られるものは少ないかもしれません。
統計は、これに「味付け」をする意味合いで、データ本来の中に隠れている傾向や性質を分かりやすく表現するために用います。
情報
ある特定の目的について,適切な判断を下したり,行動の意志決定をするために役立つ資料や知識。
引用元:大辞林
つまり、適切な判断をするために、データに「意味」を付けたものが情報です。
以下に一例を示します。
・工場Aの売上高は、年平均で10%増加している。
とある年のデータだけでなく、複数年での推移、さらには変動量の平均値を取ることで、売上高の平均増加率として意味のあるものになっています。
何らかの意志決定をするにあたって、単に統計量を求めるだけでは、判断材料が不足しているかもしれません。
データを意味のあるものにする、つまり判断材料となる「情報」に変換して活かすことができるというわけです。
これらの3つの要素の中で「情報」だけが重要なわけではなく、いずれが欠けても的確な情報の伝達は成立しません。
どう加工して、最終的に何を導き出すか、やり方は人それぞれです。
ただし、効率的・理論的にやる方法があります。
それが「統計学」です。
データを解析し、そこに潜む有益な情報をいかに引き出すか、その助けになるのが統計学です。
相手に伝えるためには、情報にするんだね
データの分析と解析
ここで、両者の違いに触れておきます。
- 分析とは、どのような要素があるのか現状を知ること。
- 解析とは、なぜそうなっているのか原因を探ること。
普段、何となく使っていますが、データ収集の次に分析を行い、さらに分析で得られた結果を元に考察して解析するという流れで進めます。
例えば、主成分分析や分散分析は取得データから現状を知ること、多変量解析はデータの関係性を明確にすること、といった使い分けをします。
なぜデータ解析が重要なのか?
モノづくりの現場では、必ず品質のばらつきが生じます。
許容範囲を超えると、異常品や不良品として現物に見えるようになります。
ばらつきを無くすことはできませんが、ばらつきから生じる異常を最小限に抑えることは必要です。
つまり、ばらつきの把握、事実の正確な把握が重要であり、これには統計的手法を用いることが欠かせません。
統計的品質管理(SQC)
統計的な解析手法を用いて品質管理を行うことで、英語ではStatistical Quality Control(SQC)と呼ばれています。
まさに先ほど説明した統計と解析の話です。
実際の現場では、限られたサンプルと時間で品質を把握し、客観的指標で判断することが求められます。
そのためには、適切なデータ収集、分析、解析が必要であり、基本的な例として、QC7つ道具や新QC7つ道具が挙げられます。
高度な問題の場合は、多変量解析や実験計画法などを用いることもあります。
つまり、安定した工程を維持するため、事実を客観的に捉えて方策を検討する。その手段として、データの解析がポイントということです。
まずは、ばらつきを知ろう
データの種類
まず、大きく分けて、言語データと数値データがあります。
言語データは、「大きい」「きれい」「静か」といった言葉で表現されるもの。
数値データは、数値で表現されるデータを意味し、さらに以下の2つに分かれます。
- 計量値:温度、時間など、連続的に変化する値。
- 計数値:個数、人数など、離散的に変化する値。
演算で求めた場合は、割り算と掛け算のケースで扱いが異なります。
組合せは多いけど、ルールはシンプル
データ収集の注意点
最後にデータ収集の注意点をお知らせします。
- 目的を明確に
- 素性を明確に
- 忠実に正確に
- 目的を明確に
まず、目的を決めてから行動に移しましょう。
目的を達成するために、どのような項目をどのくらいの期間とれば良いのか、きちんと決めておかないと、取得したデータに過不足が生じます。 - 素性を明確に
前提条件が異なるデータどうしで比較しても、誤った解釈をしかねないので、常に5W1Hを意識して確認しましょう。 - 忠実に正確に
これは大前提で当たり前のことですが、正確なデータを取ることを心がけましょう。
恣意的な選別や適当な測定は、事実とは異なり、客観的に判断するという観点から外れています。
こてつ経験談
腕の見せどころ
私が新人の頃に担当していた製品でトラブルがあり、現状の調査として対象工程のデータを集めることになりました。
取るべきデータは決まっており、基本的に誰がやっても同じでしたが、その後のデータ整理は自分なりに考え、工夫してまとめたつもりでした。
ちょうど、一通りのまとめを終えた頃、実は同じトラブルが過去にもあったことが分かり、当時の資料を捜索することになりました。
見つかったのは、ベテラン先輩のまとめたもので、資料を見た途端に驚きを感じました。
同じ地点からスタートしたはずですが、データの加工のしかた、考察の深さが全然違い、最終的に導き出した結論は非常に洗練されていたのです。
まったく別の調査ならともかく、同じことをやっているのに、引き出せる情報量の違いを体感して、データ解析の重要性を知りました。
これは逆の言い方をすると、やり方しだいで、自分の腕の見せどころになるということです。
スマートにデータを整理し、多角的な視点から考察を深めて、「エンジニアとしてのセンスが現れるんだな・・」と、当時は浅い経験ながら実感していました。
データは語る
はじめは見よう見まねで修正し、先輩の資料に近づけることを実践しました。
なかなか意図を汲み取れず、理由は後になってから分かったことも多々ありました。
ただ、このように作成者の意図を考えながらデータ解析の経験を積んでいくうちに、自然と同じ思考回路が身についてきたと思います。
同じデータでも、まとめ方ひとつで、見え方は全然違うものになってきます。
データが発している言葉を聞き逃さず、うまく加工して整理して、その情報を最大限に引き出していきたいものですね。
まとめ
- データ:推論の基礎となる事実
統計:集団の傾向や性質を数量的に導き出すこと
情報:適切な判断をするために、データに意味を付けたもの - なぜデータ解析が重要なのか
⇒安定した工程を維持するためには、統計的手法により事実を客観的に捉えたデータ解析が必要となるから - 計量値:温度、時間など、連続的に変化する値
計数値:個数、人数など、離散的に変化する値 - データ収集の注意点
⇒①:目的を明確に
②:素性を明確に
③:忠実に正確に
統計的手法は、データ整理を効率的に進められるだけでなく、相手に情報を的確に正確に分かりやすく伝える有効な手法です。
うまく使いこなして、スマートな解析ができるようにスキルアップしてきましょう。
コメント