「数式を使わないデータマイニング入門」を読んだ

こんにちは。
最近、統計・データマイニングに興味があって、概要を掴みたいと思っていたので、下の本を読むことにしました。けっこうおもしろかったです。

数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)

数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)


本の概要メモです。

                                                                                                                                  • -

データマイニングの手順
1.大量のデータから法則を発見する
2.得られた法則から使えるものを選ぶ

データマイニングでは法則を発見してくれるが、原因は説明してくれない。
例えば、A→Bになる。
しかし、なぜA→Bになるのかは説明されない。

データマイニングの手順の詳細
1.何を明らかにしたいか目標を設定する
2.データの集め方の検討
①行いたいデータマイニング用にデータを収集する
②既存のデータをデータマイニング用に転用する
3.不必要なデータの削除、分析する情報の選定
4.1つの情報で分析して法則を探す。異常値の扱いを考える。仮説→検証の繰り返し
5.複数の情報で分析して法則を探す。仮説→検証の繰り返し

それぞれの分析手法
・分類→クラスタ分析、決定木分析、自己組織化マップ
・関連発見→連関規則
・予測→回帰分析、ニューラルネットワーク

                                                                                                                                              • -

4章.回帰分析
あるデータから別のデータを予測、場合によっては式の精度がかなり低くなることもある
5章.決定木
定性的な情報を分類する手法
6章.クラスタ分析
分類には教師あり学習と教師なし学習の2つがある。
・教師あり学習は過去のデータを元にグループ化
・教師なし学習は未知のデータからグループ化
クラスタ分析は後者

7章.自己組織化マップ
8章.連関規則
物事の関連性をルール化
A→B。(Aが起これば60%の確率でBが起こるなど)
9章.ニューラルネットワーク
人間の神経回路を抽象化したもの
10,11章、データマイニングの危険性などについて

                                                                                                                                  • -

数式は使わないので、実用性はゼロですが、データマイニングの概要を掴みたい人、統計学の手法をどう言う時に使うのか知りたい人におすすめだと思いました。

ただし、概要しかつかめないので、今後学んでいくには別の本が必要です。
この本では以下の2つの本が勧めらています。


データマイニング手法―営業、マーケティング、CRMのための顧客分析

データマイニング手法―営業、マーケティング、CRMのための顧客分析

やさしい確率・情報・データマイニング

やさしい確率・情報・データマイニング


どんどん勉強していきます。統計学データマイニングおもしろいです。