Temel Bileşen Analizi (Principal Component Analysis) nedir?

Temel Bileşen Analizi (Principal Component Analysis) nedir?

Principal Component Analysis (PCA – Temel Bileşen Analizi)  Nedir?

Principal Component Analiz, çok değişkenli bir veriseti içerisindeki bilgiyi daha az değişkenle ve minimum bilgi kaybıyla açıklamanın bir matematiksel tekniğidir. Başka bir tanımla PCA, çok sayıda birbiri ile ilişkili değişkenler içeren verisetinin boyutunu, veriseti içerisindeki veriyi koruyarak daha küçük boyuta indirgenmesini sağlayan bir dönüşüm tekniğidir. PCA, büyük boyutlu verisetlerindeki boyutsallığı azaltır. Teknik, boyut küçültme işleminde veriseti içerisindeki değişken sayısını azaltmayı hedefler. Dönüşüm sonrasında elde edilen değişkenler ilk değişkenlerin temel bileşenleri olarak adlandırılır. İlk temel bileşen olarak varyans değeri en büyük olan seçilir ve diğer temel bileşenler varyans değerleri azalacak şekilde sıralanır.

 

PCA’nın uygulanması sonucu sınıflandırılan veri türleri

 

Gürültüye karşı düşük hassasiyet, bellek ve kapasite ihtiyaçlarının azalması, az boyutlu uzaylarda daha etkin çalışması PCA’nın temel avantajları arasında sıralanabilir. Özetleyecek olursak eğer PCA’nın üç temel amacı vardır:

  1. Verilerin boyutunu azaltma
  2. Tahminleme yapma
  3. Veri setini, bazı analizler için görüntülemek

PCA’nın Temel Matematiksel Yapısı

PCA’nin temeli verisetlerindeki değişkenler arası Kovaryans ve Korelasyon matrisinin sprektral özelliklerine dayanmaktadır. Bu matrisler simetrik ve pozitiftir. Bu matrislerin özdeğerleri varyansları ile özdeştir. Bu özelliklerinden ötürü son derece etkili bir PCA tekniği ortaya çıkmaktadır.

Başka bir deyişle PCA, verisetlerinin kovaryans ve korelasyon matrislerinin özdeğer ve özvektörlerini bulma işlemidir. Yazılımsal gelişimin öncesinde bu teknik oldukça uğraştırıcı ve zahmetli bir teknikti. Ancak R paketleri tekniği hem kolaylaştırdı hem de son derece anlaşılır görseller haline getirdi.

PCA’nın Uygulama Adımları

PCA genel olarak 5 temel adımdan oluşur:

  1. Verileri hazırlama
  2. Kovaryans/Korelasyon matrisini oluşturma
  3. Kovaryans/Korelasyon matrisinin özdeğerlerini ve özvektörlerini hesaplama
  4. Temel bileşenleri (Principal Components) seçme
  5. Yeni verisetini hesaplama

Yazar Hakkında

Henuz yorum yok

forum Henuz yorum yok

Ilk yorum yapan siz olun

Bir yorum yaz

menu
menu