#9 R Programlama | Görselleştirme (+ggplot)

Bazı verisetlerinde kategorik değerlerin “mükemmel, pekala, iyi , orta, fena değil, kötü, çok kötü” olarak sıralandığını görmüş olabilirsiniz. Ancak R mükemmel’in pekala’dan daha iyi olduğunu daha büyük olduğunu veya orta’nın pekala’dan küçük olduğunu bilebilir mi? Yani bunlar kategorik değerler dolayısıyla factor’ler ancak R bunlar arasında bir sıralama yapabilir mi?

Evet yapabilir ama nasıl? Buna uygun bir veri seti bulduk hazır ggplot’tan. Orada yapmışlar işte şöyle olmalı.

str ile içeriğine bakarız.
ord factor yazısına bakalım?

Ordered factor yani sıralanmış faktör yazısını görüyorsunuz, cut, color ve clarity attribute’lerinde. Bunu nasıl yapabiliriz ki?

Görünüşe bakılırsa oldu.
Evet olmuş bu iş.

Artık R orada yazan kelimelerin birbirine üstünlüklerini de biliyor böylelikle. Öte yandan bir çubuk grafik çizdirmek istediğimde şöyle bir kod yazmam yeterli olabiliyor.

y ekseni yazmadım?
yine de y eksenini count aldı.

Çünkü default olarak bir şey girilmediğinde count olarak alıyor y eksenini.

Şöyle bir iki satır kod yazsak sırasıyla çıktılar…
bu şekilde ve…
şu şekilde olur.

Şimdi geom_bar olayının default olarak stat=”count” değeri yerine identity’yi kullanalım ne değişecek? Her zaman count işimize gelmeyebilir istersek count yerine başka bir şey koyabilmeliyiz.

Yazacağımız kod.
Alacağımız çıktı, artık count değil carat yazıyor orada.


Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir