
Pernyataan Masalah
Anggaplah kita memiliki dataset deret waktu yang berisi angka penjualan harian toko ritel selama setahun. Tugas kita adalah menganalisis kumpulan data ini dan menghitung rata-rata penjualan selama 7 hari untuk memuluskan potensi anomali, mengidentifikasi tren, dan memandu keputusan bisnis. Kami akan menggunakan Python, bahasa pemrograman yang terkenal dan banyak digunakan untuk analisis data.
Pendekatan Solusi
Untuk mengatasi masalah jendela bergulir, kami akan mengikuti langkah-langkah ini:
- Impor perpustakaan yang diperlukan
- Muat kumpulan data
- Buat jendela bergulir
- Hitung rata-rata pergerakan 7 hari
- Visualisasikan hasilnya
Mari kita mulai dengan mengimpor pustaka yang diperlukan dan memuat kumpulan data.
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# Load dataset (Assuming the dataset is a CSV file)
data = pd.read_csv('sales_data.csv')
# Preview the dataset
print(data.head())
Setelah memuat dataset, kami sekarang melanjutkan untuk membuat jendela bergulir.
Membuat Jendela Bergulir
Kami beralih ke yang kuat Panda perpustakaan untuk membuat jendela bergulir menggunakan rolling() fungsi. Rolling window akan memiliki ukuran 7 hari, karena kami ingin menghitung rata-rata pergerakan 7 hari.
# Create a rolling window of 7 days rolling_window = data['sales'].rolling(window=7)
Sekarang kita memiliki rolling window, kita dapat menghitung rata-rata pergerakan 7 hari.
Menghitung Rata-Rata Pergerakan 7 Hari
Untuk mengetahui rata-rata pergerakan penjualan 7 hari, kita cukup memanggil mean() berfungsi pada objek rolling window kita. Kami kemudian menambahkan rata-rata pergerakan baru ini sebagai kolom baru di kumpulan data kami.
# Calculate the moving average data['7_day_avg'] = rolling_window.mean() # Preview the updated dataset print(data.head(10))
Terakhir, mari visualisasikan hasil kita untuk lebih memahami tren dalam data kita.
Memvisualisasikan Hasil
Kami akan menggunakan yang populer Matplotlib perpustakaan untuk membuat bagan garis sederhana yang menampilkan data penjualan harian dan perhitungan rata-rata pergerakan 7 hari kami.
# Plot the daily sales data
plt.plot(data['sales'], label='Daily Sales')
# Plot the 7-day moving average
plt.plot(data['7_day_avg'], label='7-Day Moving Average', color='red')
# Add labels and legend
plt.xlabel('Days')
plt.ylabel('Sales')
plt.title('Daily Sales and 7-Day Moving Average')
plt.legend()
# Display the plot
plt.show()
Bagan yang dihasilkan menampilkan data penjualan harian bersama dengan rata-rata pergerakan 7 hari, sehingga memudahkan kami untuk mengidentifikasi tren dan anomali.
Kesimpulannya, rolling window banyak digunakan dalam analisis data, khususnya deret waktu, karena kemampuannya mengungkap pola dan tren tersembunyi dalam kumpulan data besar. Kombinasi Python, Pandas, dan Matplotlib menyederhanakan proses penghitungan rata-rata bergerak dan memvisualisasikan hasil, menjadikannya subjek yang dapat didekati baik oleh pemula maupun ahli di bidangnya.