Histogramın Çizilmesi
Veri Sınırları ve Frekansları
Öncelikle, histogram çizmek için prolinin mg/gr cinsinden sınırları ve bu sınırlara karşılık gelen frekans değerlerini kullanacağız.
- Sınırlar (mg/gr): 0-10, 11-20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90
- Frekanslar (F): 0, 5, 66, 82, 95, 76, 60, 29, 8
Histogram Çizimi
Histogram, bu verileri görsel bir şekilde ifade etmek için kullanılacak bir çubuk grafiktir. Python’da matplotlib kütüphanesini kullanarak bir histogram oluşturabiliriz. Burada her bir sınıf aralığı çubukların genişliği olarak alınır ve yükseklikleri sınıfdaki frekans değerleri ile belirlenir.
import matplotlib.pyplot as plt
# Proline mg/gr sınırları
proline_ranges = ['0-10', '11-20', '21-30', '31-40', '41-50', '51-60', '61-70', '71-80', '81-90']
# Frekanslar
frequencies = [0, 5, 66, 82, 95, 76, 60, 29, 8]
plt.figure(figsize=(10, 6))
plt.bar(proline_ranges, frequencies, color='blue')
plt.title('Histogram of Proline Concentration in mg/gr')
plt.xlabel('Proline Concentration (mg/gr)')
plt.ylabel('Frequency')
plt.show()
Bu kod, prolin konsantrasyonunun frekans dağılımını gösteren bir çubuk grafik üretir.
Medyan ve Mod Hesaplanması
Medyanın Bulunması
Medyan, bir veri setinin orta noktasındaki değerdir ve verileri ikiye böler. Veri sayısı çift ise ortadaki iki değerin ortalaması alınır.
Eklenik frekansları kullanarak, toplam veri sayısının yarısına denk gelen değeri bulacağız ve hangi aralığa düştüğünü belirleyeceğiz.
- Toplam Veri Sayısı (N): 421 (Eklenik frekansların son değeri)
- N/2: 421 / 2 = 210.5
Eklenik frekanslara bakıldığında, 210.5 değeri 153 ve 248 arasında (31-40 mg/gr aralığı) yer alır. Bu nedenle medyan bu aralıktadır.
Modun Bulunması
Mod, en sık tekrar eden değerdir, yani en yüksek frekansa sahip sınıf. Buradan, 41-50 mg/gr aralığının mod olduğunu görüyoruz çünkü bu aralığın frekansı (95) en yüksek değerdir.
SONUÇ:
- Medyan: 31-40 mg/gr
- Mod: 41-50 mg/gr
TERİMLER:
Histogram: Veri dağılımını görsel olarak temsil eden çubuk grafik.
Medyan: Sıralanmış bir veri setinin ortasında yer alan değer.
Mod: Bir veri setinde en sık rastlanan değer.
Frekans: Belirli bir veri aralığının kaç kere tekrarlandığını gösteren sayı.
Eklenik Frekans: Verilerin kümülatif (birikimli) toplanmasıyla elde edilen frekans.