Masalah utama yang terkait dengan memplot distribusi normal dengan Python adalah sulitnya merepresentasikan data secara akurat. Distribusi normal adalah distribusi probabilitas kontinu, yang berarti bahwa ia memiliki jumlah nilai yang mungkin tak terbatas dan oleh karena itu tidak dapat secara akurat diwakili oleh kumpulan titik yang terbatas. Selain itu, saat memplot distribusi normal, penting untuk memastikan bahwa sumbu diskalakan dengan benar sehingga data dapat diinterpretasikan dengan benar. Terakhir, mungkin juga ada masalah dalam menentukan jenis plot mana (misalnya, histogram atau grafik garis) yang paling mewakili data.
import matplotlib.pyplot as plt import numpy as np mu, sigma = 0, 0.1 # mean and standard deviation s = np.random.normal(mu, sigma, 1000) count, bins, ignored = plt.hist(s, 30, density=True) plt.plot(bins, 1/(sigma * np.sqrt(2 * np.pi)) *np.exp( - (bins - mu)**2 / (2 * sigma**2) ),linewidth=2, color='r') plt.show()
1. Impor pustaka matplotlib dan tetapkan alias "plt".
2. Impor pustaka numpy dan berikan alias "np".
3. Tetapkan 0 untuk mu (mean) dan 0.1 untuk sigma (standar deviasi).
4. Buat array 1000 angka acak dengan rata-rata mu dan standar deviasi sigma menggunakan fungsi normal acak numpy, dan tetapkan ke variabel s.
5. Gunakan fungsi hist plt untuk membuat histogram dari array s, dengan 30 bin, dan atur densitas ke True untuk estimasi densitas probabilitas.
6. Plot garis di atas histogram menggunakan fungsi plot plt, dengan bin sebagai nilai sumbu x, 1/(sigma * np.sqrt(2 * np.pi)) *np.exp( – (bins – mu) **2 / (2 * sigma**2)) sebagai nilai sumbu y, lebar garis diatur ke 2, dan warna diatur ke merah ('r').
7. Tampilkan plot menggunakan fungsi show plt
Merencanakan perpustakaan
Python memiliki berbagai pustaka plot yang dapat digunakan untuk membuat visualisasi data. Matplotlib adalah perpustakaan paling populer untuk memplot dengan Python dan menyediakan berbagai fitur untuk membuat berbagai jenis plot. Seaborn adalah perpustakaan populer lainnya yang dibangun di atas Matplotlib dan menyediakan fitur tambahan seperti palet warna, fungsi statistik, dan gaya plot. Bokeh adalah perpustakaan lain yang berfokus pada visualisasi interaktif, yang memungkinkan pengguna membuat plot interaktif dengan penggeser, tombol, dan widget lainnya. Plotly adalah perpustakaan yang lebih baru yang menawarkan plot statis dan interaktif dengan kemampuan untuk mengekspornya sebagai file HTML atau JavaScript.
Apa itu kurva distribusi normal
Kurva distribusi normal di Python adalah representasi grafis dari distribusi probabilitas yang mengikuti distribusi normal (atau Gaussian). Ini adalah kurva berbentuk lonceng simetris yang ditentukan oleh rata-rata dan standar deviasinya. Distribusi normal memiliki beberapa sifat, seperti unimodal, simetris terhadap rata-rata, memiliki area tetap di bawah kurva, dan memiliki varian berhingga. Di Python, grafik jenis ini dapat dibuat menggunakan pustaka matplotlib.
Bagaimana merencanakan distribusi normal
Untuk memplot distribusi normal dengan Python, Anda dapat menggunakan pustaka matplotlib. Pertama, impor pustaka dan atur ukuran gambar:
impor matplotlib.pyplot sebagai plt
plt.rcParams[“angka.figsize”] = (10,7)
Selanjutnya, tentukan mean dan standar deviasi data Anda:
rata-rata = 0
std = 1
Kemudian buat rentang nilai x dari -4σ hingga 4σ:
x = np.linspace(-4*std, 4*std, 100) # 100 bilangan dengan spasi linier dari -4σ hingga 4σ
y = 1/(np.sqrt(2*np.pi)*std)*np.exp(-0.5*((x-mean)/std)**2) # persamaan distribusi normal
Terakhir, plot data menggunakan fungsi plot matplotlib:
plt.plot(x, y) # Merencanakan data kita
plt.title(“Distribusi Normal”) # Menambahkan judul ke grafik kita
plt.show() # Menampilkan grafik kita