データサイエンスに必要な知識はPythonを使って一通り学習することができます.
しかし,データサイエンスにはいろいろな分野の知識が必要なので何から手を付けていいのかわかりにくいという現状があります.
データサイエンスに必要な知識の例を簡単に挙げていこうと思います.
- Numpy
- Pandas
- データの入出力
- データの可視化(Matplotlib,Seaborn)
- データ解析
- 機械学習(Sckit-Learn)
などなど
Numpy
まずNumpyは科学計算に必要な基本的なパッケージの一つです.
ベクトルや行列といったアレイ(array)の作り方を学ぶことができます.
Pandas
PandasはPythonでデータ処理をするために作られた超高機能なライブラリ
特にSeriesやDataFrameなどを用いたデータの処理の方法や可視化についても学ぶことができます.
データの入出力
テキスト,Excel,CSV,JSONなどのさまざまなフォーマットでをPythonを扱うことができるようになる.
データの可視化
MatplotlibやSeabornを使い,ただ見えるだけでなくデータの解析そのものになる.
機械学習
機械学習のアルゴリズム(線形回帰,ロジスティック回帰など)も学ぶことができる.
pythonにはScikit-Learnといった非常に優れたライブラリがある.
このようにPythonにはさまざまな種類があります.そして自分の目的に応じたものを勉強していくことがおススメだと思います.