Bu proje, seçilen medikal özelliklere dayanarak diyabeti tahmin etmek için Decision Tree Classifier kullanır.
- Dosya:
diabetes.csv - Özellikler:
Glucose,Insulin,BMI,Age - Hedef:
Outcome(0 = Sağlam, 1 = Diyabetli)
- Kategorik değerler (
Yes/No) sayısal değerlere (1/0) dönüştürülür. - Seçilen özellikler:
Glucose,Insulin,BMI,Age - Hedef değişken:
Outcome
- Veri seti %50 eğitim ve %50 test olarak ayrılır (
train_test_split,random_state=42)
- Decision Tree Classifier,
max_depth=100parametresi ile oluşturulur - Model eğitim verisi üzerinde eğitilir
- Karar ağacı
matplotlibile çizilir - Düğümler özellik ve sınıf isimleri ile etiketlenir:
0: Sağlam (Healthy)1: Diyabetli (Diabetic)
- Doğruluk (Accuracy): %71
- Karışıklık Matrisi (Confusion Matrix):
- [[197 54] [ 57 76]]
- F1 Skoru: 0.578
- Classification Report: Her sınıf için precision, recall ve F1 skoru
Not: Model sağlıklı hastaları tahmin etmede oldukça başarılı, ancak diyabetli hastalarda performansı daha düşük. Özellik seçimi ve hiperparametre optimizasyonu ile model performansı artırılabilir.
Bu proje, KMeans algoritmasını kullanarak rastgele oluşturulmuş veri kümelerini analiz etmeyi ve görselleştirmeyi amaçlamaktadır.
make_blobsfonksiyonu ile 4 merkezli, 560 örnekten oluşan rastgele veri kümesi oluşturulurx: Özellikler,y: Gerçek etiketler
n_clusters=10ile KMeans tanımlanır- Model veri üzerinde fit edilir ve her veri noktası bir kümeye atanır (
labels)
cluster_centers_ile bulunur ve görselleştirmede kırmızı X ile gösterilir
matplotlibile veri noktaları ve kümeleri renklerle gösterilir- Küme merkezleri vurgulanır ve legend ile açıklanır.
Bu proje, Decision Tree Classifier kullanılarak diyabet tahmini yapılmasını ve model performansını artırmak için hiperparametre optimizasyonunu içerir.
- 3 katlı çapraz doğrulama ile modelin genel doğruluğu ölçülür
max_depthiçin değerler denenir:[3, 5, 7, None, 15]- 5 katlı çapraz doğrulama ile en iyi hiperparametre seçilir
- En iyi parametre ile model tekrar test edilir ve performans raporlanır
- Python 3.x
- pandas, numpy
- scikit-learn
- matplotlib, seaborn

