ひさしぶりにPython

ひさしぶりにPythonを使い始めた。
現在の業務は、5割がコーディングで残りの5割が会議、資料作成。
コーディングの5割りのうち、4割がSQLで残りの1割がTableauのダッシュボード作製というところ。
実はRやPythonを使ったいわゆる「データサイエンティスト」的な作業はほぼやっていない。とはいえ、この作業配分はうちの会社に限らずだいたいこのようなものだと思う。コンサルティング会社のときにクライアント企業のデータ分析部門(というものもほぼなかった)や現在の会社で300通以上の履歴書を見て、面接して情報収集する中で得た感触なのでほぼ間違いない。
よくいうように、データ分析の仕事の8割がdata wranglingに費やされることを考えると、データ分析者の作業時間の割り振りはこのようなものである。またデータ分析結果に基づいてアクションを起こすのはデータ分析者でなく、セールスやファイナンスといったビジネスユーザー部門であることももうひとつの要因であり、彼らが求めているのは通常「今何が起きているか」を把握するためのDescriptive analysisであり、「何が起きるか」を把握するPredictive analysisや、「何をすべきか」を把握するPrescriptive analysisは技術的にできても求められないというのが実情である。

さて、そんな中で久しぶりにPythonを使ったのは、インターンで来ている子が作ったレストランのセグメンテーションのプログラムを引き継ぐことになったからである。夏場彼は論文作成の最終段階にかかるので、インターンの作業ができない、そのため引き継ぐことになった。
おおよそ3年ぶりに使うPythonPythonの便利ツールAnacondaは相当進化していて、もはや無料ツールとは思えない操作のしやすさである。ライブラリの追加も黒いComand promptの画面からやらないでいいし。

彼曰く、オランダの大学のデータ分析研究室においては、9割の人がPythonユーザーで残り1割がRユーザー。確実に世の中の主流はPythonになりつつある。私も時代に乗り遅れないようにPythonを学んでおこう。