Microsoftがセクシーと公表した職業とは…

1656viewsgamagama

このエントリーをはてなブックマークに追加
統計学が最強の学問である

Microsoft JobsBlogに掲載された今後もってもあつい3つの専門性

•データマイニング、機械学習、人口知能、自然言語処置
•ビジネスインテリジェンス、競合分析
•分析、統計ー特にウェブ分析、A/Bテスト、統計分析

データをビジネスに使うための「3つの問」

•何かの要因が変化すれば利益があがるのか
•そういう行動を起すような事は実際に可能なのか
•変化を起す行動が可能だとしてそのコストは利益を上回るか
結果重要なものは3つの問に答えれる「十分なデータ」と「適切な比較」という「統計的因果推論」を身につける事が大事
統計のデータを扱えるようになればあとは「統計の向き」

比較対象の条件での統計学の二つの条件

•「関連しそうな条件」をふまえてでき手法を用いて、測定された条件について「フェアな比較」を行う
•解析ではなくそもそものデータの取り方の時点で「フェア条件をなそろえる」

「誤差」への3つのアプローチ

•実際のデータは扱わず、ただ仮説や事例を報告する
•上手くいった事例のみを報告する
•ランダム化を用いて因果関係を悪率てきに表現する

ランダム化の3つの限界

•「現実の壁」
絶対的なサンプル数の制限と条件の制御不可能性
•「倫理の壁」
•「感情の壁」

統計学の6つの分野

1、実態調査を行う社会調査法

 可能な限り偏りなく、求めらる誤差の範囲に収まる推定値をもっとも効率よく得るためにはどうしたらいいかを研究

2、原因究明のための疫学・生物統計学

3、抽象的なものを測定する心理統計学

4、機械的分類のためのデータマイニング

5、親善言語処理のためのテキストマイニング

形態素分析文
文書を単語毎に分割し、どの様な単語が何回使われているかを集計する作業の事
N-Gram
機械的に重複を許したN文字ずつの文字列を切り出し、そこから求める単語を探す

6、演繹に関心を寄せる計量経済学

感想

事前の知識が必要な本であり、文型の数学嫌いにはおすすめしない。構成が事前知識→本題ということ具体例が比較的おおいのでよみやすいが、たまにまどろっこしい、笑

このまとめと関連のあるカテゴリー

関連まとめ

本のまとめカテゴリー


コメントを書く