Translate

2017-01-01

データって何??2016年の「データの出来事」

2017年あけましておめでとうございます。
昨年2016年は選挙や投票というニュースをきっかけに色々と考えさせれました。
いや、考えたというより混乱しました、、、。

  • イギリスのEU離脱投票
  • 東京都知事選挙
  • アメリカ大統領選挙
  • ・・・etc


世界中日本中の「知」が、より高精度なデータを集めながらも正確な結果を予想できませんでした。我々は、基本的にマスコミや識者から出てくる情報を参考にしなければなりません。複数回のサンプリング調査など素人では出来ないからです。もちろん、各国、各局、それぞれの思惑があるのでしょうから、鵜呑みにすることもできないのですが、心構えや論点の参考にはしています。昨年の投票前の報道と結果を見る限り、私は一体なんのデータを見ていたのだろうと思ったのです。
見過ごし、聞き流した部分がたくさんあるはずです。
出てきた予測の根拠(データ)をちゃんと理解していない。極端に言えば、私は思いつきの予測をしていたのでしょう。
投票結果の政治的な面やどちらに国益、私益があるということは関係なしに、データに基づく予想というものに関心を持ちました。

また、昨年は人工知能、ビッグデータ、機械学習、、そういうキーワードを毎日のニュースの中に見つけることができました。また、それらを一個人の開発者の方々がブログ等で記事を書き、それらを読ませていただき、身近に感じることができるようになったのです。
果たして、本当に個人でも関われることなのかどうかは、これから検討するのですが、興味深い分野であることには間違いありません。
データを上手に扱う。データを正確に扱う。単純にそれだけのスキルでもビジネスで役立つことも多いでしょう。それら分野と親和性の高いPythonを使うことが多いようですが、私がこれまでMVCのWebアプリをPythonを使って開発してきた経験が少しは役に立つかもしれません。

これまで、漠然と取り組んできたWebやアプリ開発ですが、「データサイエンス」「データエンジニアリング」「統計学」といったキーワードを中心に据えて、様々な方向の切り口から見ていこうと思います。
苦手な数学ももう一度やり直さなければならないですが(笑)
また、出遅れているという気持ちもあります。ただこれに関しては何をやっても出遅れているのでしょうから、追いつけ追い越せでやるだけです。

ではまず手始めに何をやるか。
Excel基礎!
いやいや、そういう巨大なアプリは苦手です。
また作業の手順を記録できないので、基本的にはテキストエディタを使ってかけるプログラムになると思います。それだけでなく、数学なんかも基礎からやり直していきます。
次回の記事から数回、GAIQにチャレンジする記事を書いていきます。
GAIQとは、Googleが認定する「Google アナリティクス個人認定資格」のことです。
これを学ぶことで具体的に数字やグラフを見る訓練をしていきます。