Veri Çağı Nedir?
Facebook kurucusu Mark Zuckerberg geçtiğimiz günlerde veri gizliliğinin ihlali sebebiyle davalık olmuş ve konsey karşısına çıkmıştı. O zamandan beri veri gizliliği ve veri paylaşımı web siteleri ve büyük sistem kurucuları açısından çok önemli bir yer edindi. Farkettiyseniz bir süredir çoğu web sitesinde altta veriler hakkında bir sözleşme çıkar ve kabul etmeniz istenir gibi. Eskiden edinilen veriler yine çok değerliydi fakat maddi karşılığı yoktu, şirketler bunu dilediği gibi kullanıyordu. Bu verilerin nasıl kullanıldığı hakkında konuşmadan önce nasıl toplandığı hakkında ve bizim dahil olabileceğimiz ve para kazanabileceğimiz sistemler hakkında konuşalım.
Veri Sağlayarak Nasıl Para Kazanırız?
Bahsettiğimiz veriler sosyal medyada, arama motorlarında, web sitelerinde vs. yaptığımız aramalar, girdiğimiz sayfalar, yüklediğimiz içerikler ve aklınıza gelebilecek her türlü yapılan insan eylemi ile sağlanmakta. Bunlardan tabi ki para kazanamıyoruz. Para kazanabileceğimiz sistemlerde bilinçli/hedefli görevler ile sisteme veri sağlıyoruz. Bu işlem anketler, hedefli reklam izleme, spesifik soruları cevaplama, seçilmiş videoları izleme gibi işlemler ile sağlanıyor buna Micro-Work(Mikro-iş) diyoruz. Verilen görevleri tamamlayarak web sitesi içeriklerini insan eliyle düzenleme, çevirileri kontrol etme, içerikleri etiketleme, navigasyon içeriğini denetleme gibi görevleri gerçekleştirerek yaptığımız işlemlere ise Crowdsourcing (Kitle Kaynak) diyoruz. Crowdsourcing biraz daha işin ayrıntılı ve bir tık daha stabil paranın olduğu uzak bir çalışan gibi davrandığınız bir sistem. Bunun ücret ödeyen ve ödemeyen örnekleri mevcut. Mesela Google şirketinin Crowdsourcing sistemine gönüllü olarak katılıyorsunuz. Ücret ödeyen yani sizi çalışan olarak alan sistemlerin en ünlüsü Amazon Mechanical Turk (Amazon Mekanik Çark) sistemi. Fakat Amazon MT şuan türkiyeden katılımcı kabul etmemekte, bu oldukça üzücü bir durum. Bizim dahil olabileceğimiz en sağlam sistem Yandex'in Crowdsourcing sistemi olan Toloka. Yandex Tolokada görevleri yaparak veri sağlıyoruz ve bu veriler sistemin iyileşmesinde ve yapay zekanın eğitilmesinde kullanılıyor. Bunun alternatifi bir çok site bulunmakta, en iyi örnekleri yazının sonunda paylaşacağım.Veriler Nasıl Kullanılıyor?
Geniş açılı ve sistemlerin ihtiyacını karşılayan bir sürü veri sağladık. Şirketler ve sistemler bu veriler ile en öncelikli yapay zekalarını eğitiyorlar. Ne kadar çok insan verisi o kadar insana yakın hareket eden yapay zeka demek. Buda işleri hızlandırmakla birlikte en önemlisi organik hale getirmede bir adım. Bunun yanında navigasyon, arama, kategorileme sistemlerini insanlardan aldığı veriler ile daha organik biçimde geliştirebiliyor sistemler. Bunu yapmak için çok büyük miktarlarda hemde çok çok veriye ihtiyaçları var. Bu veriler üzerinde büyük veri (Big Data) analizleri ile işe yarar hale getirip uygulamaya sokabiliyorlar. Bu bahsettiklerim dışında bu veriler akla gelebilecek her şekilde belkide akla gelemeyecek şekilde ve sonuçlar doğurabilecek şekilde kullanılıyor. İşin özü bu veriler inanılmaz değerli!
Katılabileceğiniz Sistemler:
Amazon Mechanical Turk: http://link.tl/24NrY (Türkiyede aktif değil, Görevler: Crowdsource)
Yandex Toloka: http://link.tl/24Nrm (Görevler: İçerik Düzenleme, Crowdsource)
Micro Workers: http://link.tl/24Nsr (Görevler: Video/Reklam İzleme, Mikro-iş)
Clickworker: http://link.tl/24Ntq (Görevler: Video/Reklam İzleme, Mikro-iş)
Lionbridge: http://link.tl/24Nu8 (Görevler: Crowdsource, Çeviri, Yapay Zeka, Metin Düzenleme)
Appen: http://link.tl/24Nuq (Görevler: Crowdsource, Çeviri, Yapay Zeka ağırlıklı çok geniş yelpaze)
User Testing: http://link.tl/24NuK (Görevler: Ürün, Sistem vb Testleri. Görüntülü veya yazılı değerlendirme istenebiliyor.)
Gametester: http://link.tl/24NvZ (Görevler: Oyun test ediciliği, Game Tester)
Rev: http://link.tl/24Nwc (Görevler: Çeviri odaklı, metin-altyazı-sesli içeriği yazılıya çevirme)
Userbob: http://link.tl/24NwF (Görevler: Geniş yelpazeli ürün, sistem testleri)
Betafamily: http://link.tl/24NxA (Görevler: Geniş yelpazeli ürün, sistem testleri)