import numpy as np
from numpy.random import randn
import pandas as pd
# scipyの統計パッケージも使います。
from scipy import stats
# 描画のためのライブラリです。
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
# ブラウザ内に画像を埋め込むための命令です
%matplotlib inline
ヒストグラムの説明は以下を参照してください。 https://ja.wikipedia.org/wiki/%E3%83%92%E3%82%B9%E3%83%88%E3%82%B0%E3%83%A9%E3%83%A0
# 正規分布に従う乱数を作ります。
dataset1 = randn(100)
# bins=10がデフォルトです。
plt.hist(dataset1)
# もう一つ作ります。
dataset2 = randn(80)
# 色を変えてみましょう。
plt.hist(dataset2,color='indianred')
plt.hist(dataset1, normed=True)
# We can use normed to plot on same plot
# Set normed=True for the plots to be normalized in order to comapre data sets with different number of observations
# Set alpha=0.5 for transperancy
plt.hist(dataset1,normed=True,alpha=0.5,bins=20)
plt.hist(dataset2,normed=True,alpha=0.5,bins=20, color='indianred')
data1 = randn(1000)
data2 = randn(1000)
# 同時分布(結合分布)
sns.jointplot(data1,data2)
# もうすこし分かり易く
sns.jointplot(data1,data2,kind='hex')