データ分析を「R」言語を用いて行う際、便利なソフトとパッケージをご紹介します。
「R」とは、フリーで高度な統計学的手法を用いることが可能な言語です。
- Rstudio
Rの為の統合開発環境で、一度使うとその柔軟性の高さに虜になります。 - dplyr及びtidyr
dplyrは処理速度が速く、データラングリングには欠かせないパッケージです。
tidyrはデータフレームを変形する為のパッケージで、分析対象を追加する場合にデータ構造を簡単に変更できます。
こちらも無くてはならない存在です。 - ggplot2
分析したデータを基に作図を行う為のパッケージです。
データの可視化(データビジュアライゼーション)は、抽出・分析したデータに意味を見出す上で必要不可欠な工程です。
このパッケージは、思い描いた通りの図を容易に作成でき、作業コストの軽減に貢献してくれます。
※上記は最小限の構成です。