太陽がまぶしかったから

C'etait a cause du soleil.

SQL得意おじさんはデータサイエンティストではない

Big_Data_Prob

SQL 得意おじさんとデータサイエンティスト

 これまでの仕事の経歴として、大規模データを効率的に集計・整形したり、BIツールのためのETL基盤を構築するような案件に多く関わってきた。なので「ビッグデータの専門家」という盛った紹介をうけることもあるのだけど、それとデータサイエンティストの仕事は全然ちがうと思ったりもする。

 じぶんがやっているのはインフラエンジニアに近しいことで、これらの集計データから統計的な示唆や次の打ち手の提案までできてのデータサイエンティストであろう。そう考えると多変量解析や機械学習にまで踏み込んでいくべきなんじゃないかと思ったりもする。算数苦手だけど。

SQL 得意おじさんと経営管理のミッシングリンク

 ここのところで経営管理見習い補佐みたいな役割を兼任してKPIを見える化しながら次の打ち手を考えている。前述の通りで見える化までは得意だけど、だからどうすればよい? がその範囲内のグラフや数値からの直観に頼っていて危うい。

 もちろん、最低限の計算はしているから大枠としては誤りにくくなっていると思うが、組み合わせ爆発の中からクラスタを自動生成したり、最善手を探し出したようなことまではできてない。未だに文系脳のままブラックボックスとしてのAIに幻想を持ってしまっている証左なのかもしれないけれど、もっとバーンとよい打ち手を自動的にレコメンドしてくれないものか。

 それで、基礎の基礎から勉強しはじめて数量化1類とかをやっと理解できた程度なのだけど、そもそも機械学習可能な形にデータを変換するまでの前処理が大切なのだと分かってきた。あ、でもそれ得意。まだまだ先は長いけれど管理会計とマーケティングとデータサイエンスをうまく結びつけてAI軍師を作ろうという10年遅れの着想のスタートラインに立ちつつ、久々に勉強するのが楽しくなってきたぞ。