Geçenlerde bir arkadaş sohbetinde, bir arkadaşım eşiyle satın almak istediği bir ürün hakkında konuştuklarını ve 10 dakika geçmeden, başka bir şey için internette araştırma yaparken tam olarak konuştukları ürünün reklamını gördüğünü anlattı. Halbuki o ürünü aramamıştı bile, fakat yine de reklam karşısına çıkıvermişti. Yani bilgisayarlarımız veya telefonlarımız bizi dinliyordu.
Eminim bunu okurken bazılarınız başıyla onayladı ve belki de evet bana da böyle oldu dedi.
Peki şimdi size sormak isterim. Sizce hangisi daha olası bir durumdur?
(A) Öyle bir yazılım var ki, farklı yerel, eyalet ve federal gözetim ve mahremiyet yasalarını çiğneyerek, kimsenin bilmediği, şeyleri bulup gizlice kullanıyor ve doğru zamanda doğru yerde doğru mesaj ile önünüze getiriyor.
(B) Online davranışlarınız (ve kabul ettiğiniz gizlilik politikaları, hükümler ve koşullar) sayesinde, zenginleştirilmiş veri kümelerine erişimi olan yazılımlar tahmine dayalı modelleri ve makine öğrenimi araçları sayesinde doğru mesajı, doğru zamanda, doğru yerde önünüze koyabiliyor.
Aklınnızdan geçen soruları tahmin edebiliyorum 😀 “Zenginleştirilmiş veri seti nedir?” “Online davranış nedir?” “Öngörücü model nedir?” Ne tür bir makine öğreniminden bahsediyorsun? Bu yapay zeka mı?” veeee en favorim olan, “Arkadaşlarımla ne hakkında konuştuğumu nereden biliyorsun?”
Zenginleştirilmiş Veri Kümeleri
Veriler, diğer verilerin varlığında daha güçlüdür. Birinin adı ve e-posta adresi varsa, onlara e-posta yoluyla genel bir teklif gönderebilirsiniz. Nerede yaşadıklarını, hangi arabayı kullandıklarını, ev sahibi yada kiracı olup olmadıklarını, nerede çalıştıklarını biliyorsanız, ne yaptıkları ( Sosyal medya veya diğer herkese açık web sitelerinden alınan konum verileri veya diğer kamuya açık web siteleri ), kaç kişiden sorumlu oldukları (satın alma verilerinden anlaşılmaktadır), dün gece akşam yemeği için ne sipariş ettikleri ( sosyal medya paylaşımları), dün gece nerede yemek yedikleri (kredi kartı bilgileri – şirketin kendileriyle iş ilişkisi varsa edinmesi yasaldır), ne kadar borçlarının olduğu (kredi raporları), kredi puanları (kredi raporlama kuruluşları), vb., onlara daha hedefli bir teklif gönderebilirsiniz.
Ne kadar çok veriye sahip olursanız, tahminleriniz o kadar doğru olabilir. Ancak zenginleştirilmiş veri kümelerinde pasif bilgiden daha fazlası vardır o da Online davranışlarınızdır.
Online Davranışlar
Bir şeye tıkladığınızda, online bir davranış sergiliyorsunuz. Buna aramadaki bağlantılar, makalelere bağlantılar, web sitelerindeki bağlantılar, bir web sitesini ziyaret etme, bir video veya mesaja bakmak için bir sosyal medya sitesinde gezinmek, sola veya sağa kaydırma, akıllı telefonunuzdaki bir simgeye dokunma, akıllı telefonunuzu elinize alma ( ivmeölçer), bir sağlık uygulaması (GPS) kullanarak yürümek veya koşmak, yol bulmak için Waze, Google Haritalar veya Apple Haritalar kullanmak, Siri, Alexa, Google, Cortana veya Bixby ile konuşmak veya herhangi bir cihazda herhangi bir oyun oynamak. Tüm bu davranışlar yakalanır, günlüğe kaydedilir ve profilinizi zenginleştirmek için kullanılır.
Tüm Verilerim Tek Bir Yerde mi?
Zenginleştirilmiş profiliniz tek bir yerde değil. Ancak size hedeflenmiş bir mesaj göndermek isteyen her şirket, “müşterinin tekil profilini” oluşturmak için elinden gelen her şeyi yapar. Bu, mümkün olan en sağlam, en zenginleştirilmiş veri profilini bir araya getirmek demektir. Profil ne kadar iyi olursa, tahminler o kadar iyi olur. Google, Facebook, Amazon, Netflix, Microsoft ve Apple gibi büyük teknoloji kuruluşlarının her birimiz için sahip olduğu özel profiller hayal edilemeyecek kadar büyüktür ve yaptıkları tahminler olağanüstü derecede doğrudur. Çin’de hükümet, herkesin oluşturduğu verilerin neredeyse yüzde 100’üne sahip. Avrup Birliğinde GDPR, bizde de KVKK (Kişisel Verileri Koruma Kanunu), insanları bundan korumak için çıkarılmıştır. Tabii işe yarayıp yaramadığını söylemek için henüz çok erken.
Tahmine Dayalı Modeller
Tahmine dayalı modellerin çoğu iki genel kategoriye ayrılır: Sınıflandırma ve Regresyon.
Sınıflandırma algoritmalarının amacı, yeni verileri belirli bir sınıfa veya kategoriye ait olarak tanımlamaktır. İkili sınıflandırmalar (erkek/kadın gibi iki olası sonuç) ve çok sınıflı sınıflandırmalar vardır (veriler birden fazla sınıfa veya kategoriye ait olabilir). Bu, kabaca bir kişinin “Bu nedir?” diye sormasına, sonra da düşünüp, “Ah, bu bir bardak o zaman onu dolaba koyayım.” diye sonuca varmasına benzer.
Aile üyeleriniz, arkadaşlarınız ve ilgilendiğiniz topluluklar dahil olmak üzere birçok sınıfın parçasısınız. Matematiksel olarak Özel Tasarım Ayakkabılarını tartışacak kişilerle aynı sınıfa yerleştirildiyseniz, özel tasarım ayakkabı reklamlarını göreceksiniz. Peki sizin bu konuyu “yeni” konuşmuş olmanız tesadüf mü? HAYIR. Algoritma zaten sizin tasarımcı ayakkabılarından bahsetme ihtimalinizin yüzde 92 olduğundan emindi.
Regresyon analizi ise, bağımsız ve bağımlı değişkenler arasındaki ilişkileri ortaya çıkarmak için kullanılır. Yani hakkınızda bir sürü şey biliyorsam (geliriniz, posta kodunuz, aylık kredi ödemeniz, şu anda kullandığınız arabanın türü, yaş ve cinsiyet gibi), hangi arabayı satın almak veya kiralamak isteyeceğinizi tahmin etmek için regresyon analizini kullanabilirim.
Veri biliminde doktora derecesi yapmış bir kişi, veri açısından zengin bir kuruluş için neden yılda 1,5 milyon dolar değerindedir? Çünkü veri biliminde bir doktoraya sahip kişi, süper doğru tahminler yapmak için analiz tekniklerini yaratıcı ve verimli bir şekilde nasıl uygulayacağını bilir.
Makine Öğrenimi ve Yapay Zeka
Size işinizle ilgili 10 satırlık ve 10 sütunluk bir veri tablosu gösterseydim, sadece birkaç dakika içinde bana temsil ettiği her şeyi söyleyebilirdiniz. Çünkü işinizi, müşterilerinizi, sektörünüzü iyi bilirsiniz. Ancak, bu veri seti 25 milyon satır ve 25.000 sütun olsaydı, sizin veya başka birinin verilere bakması veya yorumlaması mümkün olmazdı. Bu yüzden buna “büyük veri” deniyor.
Büyük verilere bakmak için bilgisayarlara ihtiyacınız var ve verileri eyleme geçirilebilir hale getirmek için makinelere tahmine dayalı analiz yapmayı öğretebilirsiniz. Evet doğru duydunuz, makineler artık öğrenebilir ve tahmine dayalı analiz onların yapmayı çok iyi öğrendiği şeylerden sadece biridir.
Cihazlarınızın Neden Sizi Dinlediğini Düşünüyorsunuz?
Öncelikle “dinleme”yi tanımlamamız gerekiyor. Sesli özel görüşmelerinizde, yani kayıt altına alınabilen ve yorumlanabilen sözlerle ilgili olarak, bir devlet kurumunun emriyle gözetim altında olmadıkça veya hukuka aykırı olarak gizlice dinlenilmedikçe, kullanılacak herhangi bir araçla görüşmelerinizi kimse dinlemiyor.
Ancak, dünyanızdaki diğer tüm cihazlar (Alexa ve Google Asistan dahil) önünüze reklam mesajları veya içerik koymak için bir uyandırma sözcüğü söyledikten sonra sergilediğiniz davranışları ve sizin hakkınızda toplanabilecek verileri alır ve davranışlarınız hakkında tahminlerde bulunmak için kullanır.
Yani pratikte her şey sizi “dinliyor”. Elbette ortada odalarda kulaklıklarla oturan insanlar yok, yapay zeka kullanan veri merkezlerindeki bilgisayarlardan bahsediyorum. Kendiniz hakkında yarattığınız veriler her zaman toplanıyor, analiz ediliyor ve kullanılıyor.
Bu konuda ne yapmalı
Şimdi zor kısım geliyor. Doğru mesajlaşmanın faydalarının ve makinelerimizin bizi en yakın düzeyde tanımasının rahatlığının risklere değip değmediğini anlamamız gerekiyor. Kendi DNA’mızdan yaratılan tasarımcı ilaçlar harika görünüyor. Duygularımızı okuyabilen ve karmaşık sorunlarla başa çıkmamıza yardımcı olan araçlar korkutucu ama aynı zamanda harika görünüyor. Gerçek zamanlı olarak özel olarak bizim için yaratılmış özel film müziklerine sahip özel filmler, bilim kurgu gibi görünüyor, ancak sadece birkaç yıl uzaktalar. Nereye gittiğimizi ve nasıl seyahat etmekten hoşlandığımızı bilen kendi kendine giden arabalar da harika görünüyor.
Tüm bunlar, şirketlerin verilerimize sınırsız erişime sahip olmasını gerektirir. Bu böyle olmalı mı? Eğer öyleyse, hangi verilere erişmeliler? Sınır ne olmalı? Önümüzdeki birkaç yıl içinde – çoğunlukla da dijital cüzdanlarımızla – bu konuda oy kullanmak zorunda kalacağız. Seçilmiş yetkililerimiz de bununla uğraşmak zorunda kalacak.
Kendiniz, çocuklarınız, torunlarınız ve doğmamış gelecekteki torunlarınız için bir iyilik yapın: bu konuyu dikkatle inceleyin ve kişisel bir öncelik haline getirin . Geleceğimiz buna bağlı!