mixiユーザー(id:22942022)

2019年04月21日11:16

84 view

週記439 統計学と関係

タイトルに反して別に統計について深く語ることはしませんが、統計学的データ解析手法と私の関係について最近変化がありましたのでそのことについて書いていきたいと思います。

 関係、というと少し大仰で、ともすればミスリードになりそうな言葉ですが、あえてここではその言葉を使っていきたいと思います。

辞書を引いてみると”関係”とは以下のような意味を持っています。
《名・ス自》
1. 1.
一つまたは一組のものが他に対してもつ何らかのつながり。 「本社は彼と何の―もない」
2. 2.
それに直接(強く)かかわること。そういうかかわり。 「彼が―した事件」

また、統計の世界ではそれを更に発展させた”相関関係”というものがあり、2つの値の関係性を表します。

相関関係がない、ということは一方が変化してももう一方は変化しないということで、逆に相関関係があるということはそれぞれの変化がもう一方に何かしらの影響を与えるということを意味します。

タイトルで述べた関係という言葉はーーその言葉を使うとあまりにもじりすぎている感が出てしまってくどいと思ったので避けましたがーー私と統計学のとの間の相関関係の変化とも言えます。

つまり、ずいぶん回りくどい書き方をしてしまいましたが、私がデータ解析について学べば学ぶほど、統計という学問の私の中での位置がより明確になっていった、とそういうことが言いたかったのです。
 
 データ解析というのは様々種類がありますが、基本的に統計学のUser側である私たちにとって、その手法はほとんどが出揃っているような印象です。(あくまで現時点での印象であって、その世界では日進月歩で新しい手法の研究が進められているのでしょうけれど)

解析の種類は例えば、主成分分析(PCA)や判別分析、クラスター分析、PLS、あとはマハラノビス距離(T2)やQ統計量など、抽象化・特徴化したデータを用いたもので、有名なツールとしてはSAS社のJMP、汎用的なものではPythonやRの関数として誰でも使えるようになっています。

つまり、データ解析の理論とその実装についてはほとんど解析のための土台が出来上がっているわけです。

ですから、データ解析をするにあたっては、理論はもちろん大切ですが、データの解析手順と解釈が重要になってきます。

 解析手順と解釈、と書きましたが、ツールを使ってデータを解析すれば何らかの指標(統計量)を得ることは出来ますが、それが何を意味するのか、その結果をもとに何を判断して、次にどんな解析をするのか?という指針(地図)がなければせっかく先人たちが築き上げた高度な理論も使えません。

また、私はそんなに頭がいい人間ではないので、考えて理解できるものはそこまで多くはありません。

ですから、これまで統計学というものにほとんど触らずに生きてきた私にとって、統計学との関係はほぼ無相関でした。

しかし、実際にデータを解析する中で理解するにつれて、統計学というものと自分のこれからの方向性が相関関係を帯びてきた、というわけです。

 何かを学ぶということはエネルギーを使いますが、世界がこれまでよりもクリアになったような感覚を私に与えてくれます。

それは高校生一年生のときに私が人生で最も多くいろいろなことを学んだときよりも少なくはありますが、その世界が広がる感覚はやっぱり好きです。

以上

P.S.
 統計学というのは高度にデータが抽象化・特徴化されるため、勉強していると普通の学問に使うとはまた違う疲労感があります。一日何時間も考えるには私の脳内回路では役者不足のようで、最近は頭痛とちょっとした頭の発熱すら覚えます。
 そういうときにはもう統計思考は難しいもので、物語を読んだり動画を見たり文章を書いたりと少し右脳側の活動をするようにしています。週記もそんな感じで書いているため、最近はちょっと思考の足りない内容になっている気がしますが、まあ週記の性質を考えるのであればその時時の実態に沿ったものなので良いのではないかと思うわけです。

【最近のKaggle】
・Titanic Finish!
 Last January, I started kaggle first competition, “Titanic”. This was my first time to build up my original machine learning program, and unfortunately my program didn’t run well in January. After that I became busy and put it off until now.
 And last week, I was debugging my program and at last it could work! I jumped in delight literally!
 This is my first step to become data engineer or scientist!

【最近のCount Down】
After 461 days, the time will come.
0 0

コメント

mixiユーザー

ログインしてコメントを確認・投稿する

<2019年04月>
 123456
78910111213
14151617181920
21222324252627
282930