Pythonについて

データサイエンスに必要な知識はPythonを使って一通り学習することができます.

しかし,データサイエンスにはいろいろな分野の知識が必要なので何から手を付けていいのかわかりにくいという現状があります.

データサイエンスに必要な知識の例を簡単に挙げていこうと思います.

  • Numpy
  • Pandas
  • データの入出力
  • データの可視化(Matplotlib,Seaborn)
  • データ解析
  • 機械学習(Sckit-Learn)
    などなど

Numpy

まずNumpyは科学計算に必要な基本的なパッケージの一つです.

ベクトルや行列といったアレイ(array)の作り方を学ぶことができます.

Pandas

PandasはPythonでデータ処理をするために作られた超高機能なライブラリ

特にSeriesやDataFrameなどを用いたデータの処理の方法や可視化についても学ぶことができます.

データの入出力

テキスト,Excel,CSV,JSONなどのさまざまなフォーマットでをPythonを扱うことができるようになる.

データの可視化

MatplotlibやSeabornを使い,ただ見えるだけでなくデータの解析そのものになる.

機械学習

機械学習のアルゴリズム(線形回帰,ロジスティック回帰など)も学ぶことができる.

pythonにはScikit-Learnといった非常に優れたライブラリがある.

 

このようにPythonにはさまざまな種類があります.そして自分の目的に応じたものを勉強していくことがおススメだと思います.

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA