データサイエンス系

「政策評価のための因果関係の見つけ方 ランダム化比較試験入門」

「政策評価のための因果関係の見つけ方 ランダム化比較試験入門」を読んだ。政策評価というよりは因果推論の勉強の一環で読んだ。エビデンスに基づいた政策決定(EBPM)において、日本は後進国であると思うが、そのEBPMを進めるためのランダム化比較試験入門(…

データサイエンス100本ノック(構造化データ編)SQL版全問題解説

データサイエンティスト協会スキル定義委員によるデータサイエンス100本ノック(構造化データ編)をやってみたので、簡単に解説を書いていきます。全問題といいましたが風呂敷を広げすぎたので、適宜端折ります。今のところ、おおよそ数問毎にどのような知識が…

Kaggleの"Intro to SQL"をやってみた

自分用メモ。ドットインストールの動画をさっと眺めたぐらいでSQLを触ったことがなかったが、勉強がてらやってみた。とりあえず無料のものでいい&自分の環境でやるのはめんどくさいので、Kaggleのチュートリアルを使うことにした。 Learn Intro to SQL Tutor…

Python実践データ分析100本ノックのノック35で困ったとき

Python 実践データ分析100本ノックのノック35で ValueError: Grouper for 'is_deleted' not 1-dimensional と出て困ったときのメモ。 ぐぐるとどうやら"is_deleted"というカラムがpandasのdataframeの中に重複してできているのが原因らしい。 customer_clust…