İçerikte Neler Var?
Veri Bilim Nasıl Gelişti?
Veri ve verinin tarih içinde kaydedilmesi ile ilgili elimizdeki ilk kanıt, Afrika’da MÖ 20000 yılına tarihlenen ve üstünde çetele tutulan Ishango Kemiği’dir. Sonra Babil’de MÖ 2000 yıllarında hesaplama amacıyla kullanılan abaküsü görüyoruz. Yakılan İskenderiye Kütüphanesi’ndeki papirüs tomarlarını da buraya ekleyelim. 17. Yüzyılda İngiltere’de ölüm kayıtları tutuluyor.
Histogramın Temeli Üsküdar’da Atıldı
1854 yılında Kırım Savaşı sırasında, Üsküdar’da “gül diyagramı” adı ile dairesel histogram çizen Florance Nightingale verileri görselleştirmeye çalışıyor. Histogramın temeli Üsküdar’da atıldı desek yalan olmaz.
ABD’de 1880 sayımı için Herman Hollerith, delikli kartları kullanarak, bilgisayarın babası olan bir otomatik tablolama makinesini yapıyor. ABD’de 1965 yılında ilk veri merkezi kuruluyor. 1990 yılında Internet ve 2000’li yıllarda da büyük veri ile verinin toplanma, işlenme ve yorumlama süreci gelişerek veri bilime katkıda bulunuyor.
Veri-Enformasyon-Bilgi
Kısaca özetlediğimiz veri ve veriye ilişkin araçların tarihçesi aslında, “veri-enformasyon-bilgi” şeklindeki verinin toplanıp, düzenlenip, yorumlanmasına ve karara dönüştürülmesine ilişkin bir süreç. Veri bilim ise son yıllarda, bu süreç içinde insanın geriye çekilip, bu süreci makinenin yönetmesi; veriyi toplayıp, saklayıp, yorumlamaya başlaması ile gelişti.
Veri bilim denildiğinde belki de ilk aklımıza gelmesi gereken nokta, bilimdeki rasyonalizm ile amprisizm arasındaki ayırım. Bu ayırımda temel soru, bilgiye akılla mı, yoksa deney (veri) ile mi varılacağı sorusudur. Bilim başlangıcından beri deneyci değil, akılcıydı. David Hume ile bilime başka bir bakış açısı gelmeye ve bilimde yavaş yavaş veri sözcüğü, kuram ve hipotez sözcüklerinden daha önemli olmaya başladı.
John Tukey 50’li yılların başında verinin görselleştirilmesine katkıda bulundu, ayrıca “bit” ve “yazılım” sözcüklerini ilk kullanan kişi olarak veri bilim geliştirdi. 1997-2000 döneminde ABD’de kurulan büyük veri merkezleri de veri bilimin gelişimi için çok önemli oldu.
Larry Page ve Sergei Brin tarafından 1998 yılında alınan Sayfa Sırası algoritması patenti ve Google, dünyadaki verilere erişim konusunda büyük bir dönüm noktasıydı. Bu algoritma ile birlikte, 2000’li yılların başında ağların rassal olmadığını ortaya atan Albert Barabasi de ağ bilimini geliştirerek veri biliminin gelişmesine büyük bir katkıda bulundu. 2004 yılında Facebook, 2006 yılında Twitter ve AWS’nin kurulması ile sosyal medya aracılığı ile “büyük veri” kavramı ortaya çıktı ve veri artık çok büyük ölçeklerde oluşturulup, saklanmaya başlandı.
Veri Bilimin Temel Mantığı
Veri bilimin temel mantığında, veriyi bir ürüne dönüştürmek yatmaktadır ve 70’li yıllardan beri üzerinde çalışılan ve bu tür bir veri ürünü olan öneri sistemleri, 2006 yılındaki Netflix yarışması ile adeta patladı. Amazon, Netflix, Spotify gibi şirketlerin öneri sistemleri, ellerindeki büyük veriyi kullanarak, müşteri bazında neleri satın almaları, neleri izlemeleri, neleri dinlemeleri konusunda öneriler yapmaya başladılar.
2012 yılında Goeffrey Hinton ve arkadaşlarının geliştirdiği AlexNet modeli ile makine öğrenmesinin bir alt kümesi olan derin öğrenme önemli bir sıçrama yaptı. Bu yolla artık makine, fotoğraflardan öğrenip, sınıflama ve kestirim yapabiliyordu. Yine bir yapay sinir ağı olan ve çok büyük veri ile çalışan, önceden öğretilmiş dil örnekleriyle doğal dil işleme (NLP) yapan, 175 milyar parametreli GPT-3 modeli ise 2020 yılının ortasında devreye girdi. Derin öğrenmede kullanılan verinin büyüklüğü, bu sorunun çözümü olarak sentetik veriyi gündeme getirdi. Sentetik veri aynı zamanda, sürücüsüz otomobillerin öğrenmesinde de kullanılmaya başlandı.
Kısaca verinin çokluğu ve ticarileşmesiyle birlikte gelişen veri bilimi, büyük teknoloji şirketlerinin inanılmaz ölçüde büyümesine de yol açtı diyebiliriz. Facebook, Amazon, Twitter, Google, Microsoft, Tesla gibi şirketler veri ve veri bilim temelinde, günümüz dünyasının en büyük ekonomik gücünü, “büyük teknoloji”yi (big tech) oluşturdular.
Bu gücün ne ölçüde büyük olduğunu anlatmak için ABD’de 6 Ocak 2021 tarihinde yaşanan Kongre Baskınından sonra, 9 Ocak 2021 tarihinde Twitter’ın, o anda resmen ABD Başkanı olan Trump’ın hesabını askıya almasını da buraya bir not olarak eklemeliyiz. Veri ve veri bilim artık o kadar önemliydi ki, şirketlerin kontrol ettiği bir yönetim sistemi olan “şirketokrasi”nin hakimiyetine bile destek veriyordu.
Prof. Dr. Necmi Gürsakal 23.02.2022
1950 Bursa doğumlu. Bursa Erkek Lisesi ve Bursa İktisadi ve Ticari İlimler Akademisi mezunu. 41 yıl Uludağ Üniversitesi İktisadi ve İdari Bilimler Fakültesi’nde ve üç yıl da Fenerbahçe Üniversitesi’nde çalıştı. Çok sayıda kitabı ve makalesi yayımlandı, köşe yazıları yazdı ve TV programları yaptı. Evli ve iki çocuklu.
[…] Hesaplama hızı, geleneksel von Neumann mimarisiyle sınırlıdır, hesaplama yöntemlerine büyük veriler meydan okur, hesaplamalı güç kaynağı enerji tüketimi ile sınırlıdır ve bilgi işlem […]