Veri Bilimi Nedir? Nedendir?

Hey, bu içerik bloğumun ilk yazısı. Elbette ilk yazımız bloğun alan adında da yazdığı üzere veribilimini tanımlamalı diye düşündüm. O yüzden veri bilimi nedir diyerek başlayalım.

Veri bilimi nedir? Gibi bir yazıyı ilk kez bu blogdan okuduğunuzu sanmıyorum, eğer öyleyse bu çok şanslı olduğum anlamına gelir. Neden mi? Google‘a küçük bir “veri bilimi nedir?” araması yaptığınızda karşınıza binlerce sayfa çıkar. Kaldı ki bu sadece Türkçe aramalar için geçerli 🙂

Yani “veri bilimi” gibi yeni duyulmaya başlanan ve sektör haline gelen bu başlık bile şu an google’da, web sitelerinde oldukça popüler ve yaygın bir şekilde herkesin erişebildiği bir içerik. Varmak istediğim nokta bu kadar yeni başlıklar üzerine dahi haddi hesabı tutulamayacak kadar büyük bir veri söz konusu internette, öyle değil mi?

Artık orta çağ, yakın çağ devri kapanmış olmalı ki yıllardır dijital çağdayız. Bu çağda internet üzerinde üretilen her türlü aktivitenin bir sonucu olarak devasa miktarlarda yapısal ve yapısal olmayan veri yığınları oluşmadı mı? Ben ilk bilgisayara sahip olduğumda 2005 yılındaydık (evet şanslıyım), o yıllarda ben sahip olamasam da pek çok yerde internet bağlantısı vardı. O günlerde dahi internette bu veriler birikmeye başlamıştı ve her sene katlanarak bu verilerin artması söz konusu. Bugün 2018’in sonlarına doğru geliyoruz ve ben bu yazıyı yazarken artık devasa miktarda baş edilmesi zor bir veri yığını söz konusu değil mi? Bu hem bir problem hem de bir iş alanı 🙂 Bu arada IDC istatistiklerine göre 2020’de ulaşılacak veri miktarının 2009’un 44 katı olacağı söyleniyor.

Dünya değişiyor ve gelişiyor, yani tüm bu gelişmeler için üretilen teknolojilere ve bu veri yığınına Büyük Veri (Big Data) diyeceğiz. Büyük verinin ne olduğuna dair başka bir yazımız da olacak.

Veri bilimine dönecek olursak, aslında veri ile ilgili her konuyu inceleyen bir bilim dalıdır. Bu bilim dalı günümüzde Makina öğrenmesi, Derin Öğrenme, Yapay Zeka gibi pek çok kavramın endüstri ve teknolojiye harmanlanması sonucu daha popüler hale gelmiştir.

Toparlayacak olursak “veri bilimi” çok detaylı ve kendi içerisinde de çok fazla detay ve branş bulunduran bir bilim dalıdır.  Ben blogumda teknoloji tarafından veri biliminin önemli bileşenleri olan  Machine Learning(Makine Öğrenmesi), Deep Learning (Derin Öğrenme), Artifical Intelligence(Yapay Zeka) ve Cognitive Servisleri (Bilişsel Servisler) gibi konuları kavramak ve sizlerle de paylaşmak istiyorum.

Unutmamak gerekir ki veri biliminde amaç mevcut verinin zeka katılarak akıllı aksiyonlara dönüştürülmesidir. Diğer bir deyişle verimizden bir değer oluşturarak iş süreçlerimizin veya hizmetlerimizin kaliteli hale getirilmesidir. Dolayısıyla veri bilimi süreçlerden oluşur ve ciddi bir ihtiyaçtır.

Evet oldukça ciddi. Diyelim ki hepsiburada gibi bir siteniz var ve siz yazılım ekibinizle e-ticaret yaparak para kazanıyorsunuz. Kar marjınızı artırmayı, daha çok insana daha doğru şekilde hitap etmeyi istemez misiniz? Hatta bu tahmin edemeyeceğiniz kadar ciro(kar) ile size dönecek olsa? Nasıl mı, elbette veri bilimi ile.

Mesela Erzurum’da bir kişinin aldığı veya sistematik olarak almaya devam ettiği ürünler sizin için bir anlam ifade etmeyebilir. Ancak Erzurum’da bulunan üyelerin sıklıkla aynı kategoriden hatta aynı üründen talep ediyor olması sizin için bir şey ifade etmez mi? Evet bir kişinin yaptığı alışveriş önemsenemeyecek kadar küçük bir veri olabilir ancak özellikle Erzurum halkının anlamlı bir şekilde alışveriş yapıyor olması size işlenmesi mümkün onlarca ham bilgi yani veri sağlar. Hangi müşterinin hangi ürünleri alabileceğini tahmin ediyor olursunuz ve dolayısıyla onlara o ürünleri çok daha fazla opsiyonlarıyla sunma fırsatını yakalamış olursunuz ve bu da size büyük miktarda para, müşteri memnuniyeti olarak geri döner 🙂

Tabii bu zamana kadar oluşmuş bu veri yığınlarını analiz edip veri bilimi üzerine yatırım yaparsanız. Yapmazsanız muhtemelen e ticaret siteniz ve şirketiniz çok yakında saf dışı kalacaktır.

Daha veri nedir demeden yazıya bodoslama girmiş gibi olduk veri dediğimiz şey işlenmemiş ham bilgidir. Veri = Bilgi gibi bir yanlış anlaşılma olmasın, bilgi işlenmiştir, ancak veri hamdır. Unutmadan veri diyince sakın aklınıza excel tablosundaki satır sütun hücre içeriği gelmesin, geliyorsa sıkıntı. Çünkü aklınıza gelebilecek her şey ama her şey veridir, DNA’ mız verilerden ibarettir. Ben bunu tıpkı her şeyin atomlardan oluşmasına benzetiyorum, öyle ya teşbihte hata olmaz.

Veri ile ilgili her yerde bulunan şu dört soru başlığını sizlere aktararak “veri bilimi nedir, nedendir?” yazısını sonlandırıyorum.

Hangi veri ne işime yarar? (ki aslında buradaki gerçek soru “Ben ne bilmek istiyorum?” dur. Hangi veri ne işime yarar sorusu her şeyin veri olduğu dünyamızda tüm hatları karıştırır)

Profesyonel hayatta iş uzmanlığına denk gelir.

Veriyi nasıl edinirim? Nasıl saklarım?

Profesyonel hayatta IT uzmanlığına denk gelir.

Verinin doğruluğundan, ya da doğruysa bile zannettiğim şey olduğundan nasıl emin olabilirim?

Profesyonel hayatta Veri Yönetimine denk gelir.

ve son olarak da elimdeki bu bilgiyle sorduğum sorunun cevabına nasıl ulaşabilirim?

 Bu da gerçek hayatta geçmişte iş zekası, dün analitik, bugün veri bilimleri dediğimiz, artık istatistiği de bünyesinde barındıran uzmanlık alanına denk gelir.

Bir sonraki yazıda görüşmek üzere, iyi çalışmalar.

Bu dört soruyu veriatolyesi.com‘dan aldım 🙂 

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir