x

Facebook Günde 2.5 Milyar İçerik ve 500 Terabayttan Fazla Veri Topluyor

Facebook Günde 2.5 Milyar İçerik ve 500 Terabayttan Fazla Veri Topluyor

Facebook Data Ekibi, son paylaştıkları istatistiklerle adeta gövde gösterisi yaptı. Sosyal ağın sistemi günde 2.5 milyar içerik ve 500 terabayt veri işliyor. Bir günde 2.7 milyar “Like” ve 300 milyon fotoğraf çeken, her yarım saatte ortalama 105 terabayt veri tarayan sitenin yeni tasarısı “Project Prism”in ayrıntıları da bu detaylarda gizli.

Bunun Facebook için neden bu kadar önemli olduğunu Mühendislik Başkan Yardımcısı Jay Parikh şöyle açıklıyor: “Veri sahibi olmak, ışık tutması ve yaptığınız işte etkili olmanız açısından hayati öneme  sahip. Eğer topladıklarınızdan yararlanamıyorsanız, elinizde sadece  bir veri yığını var demektir”. Elde ettiği verileri dakikalar içinde  işleyen Facebook, böylece yeni ürünler piyasaya sürerken kullanıcı tepkisini ölçüp gerçek zamanlı tasarım değişiklikleri yapabiliyor.

Bu kadar büyük ve her geçen gün artan veriye sahip olan Facebook teknoloji tarafında da oldukça donanımlı bir ekipmana sahip. Dünyadaki en büyük Hadoop(veri toplamak için kullanılan açık kaynaklı bir  program ) sistemini kullandıklarını söyleyen Parikh, bu sistem sayesinde  tek bir cluster’da (bir depolama alanına  erişim için kullanılan en küçük birim) 100 perabayttan fazla veri depolayabildiklerini söylüyor ve kendi clusterlarının Yahoo!’nunkinden büyük olduğunu belirtiyor.

Küçük işletmeler için bu kadar veri anlamsız gibi gözükse de Parikh “birkaç ay içinde  kimse deponuzda  100 petabayt veriniz olduğunu umursamayacak. Sindirim hızı her geçen gün artıyor ve dünya veriye doymuyor” ifadelerini kullanıyor.

Toplana veriler sadece sosyal ağ için değil reklamverenler için de son derece anlamlı. Cinsiyet, yaş, ilgi alanlarını baz alarak farklı kullanıcı hacimlerinde hangi reklamların daha etkili olduğunu belirlemek amacıyla kullanılan veriler bu sebeple altın değerinde.

Facebook artık etkisini görmek için değişiklikler yapma yoluna gitme ihtiyacı bile duymuyor. Geçmişe yönelik bilgilere bakarak, üretime geçmeden önce bir modelin geçerliliğini denetleyebiliyoruz. Simulasyona koyduğumuz verilerin, tıklanma oranlarının nasıl etkileneceğini görebiliyoruz” diyen Parikh yeni projelerinden de bahsetmeyi ihmal etmiyor. ‘Project Prism’de artık, yedeklenmiş ve diğer tüm verilerle kullanıcı verilerini tek bir merkezde toplayan Facebook böylece “yekpare bir depoyu fiziksel anlamda ayırmasına rağmen tüm veriyi tek bakışta görme imkanına ” sahip oluyor. Bu proje sayesinde canlı veri seti Facebook’un California, Virginia, Oregon, Kuzey Carolina ve İsveç’teki veri merkezlerine dağıtılmış oluyor.

Şirket olarak veriler arasında, reklam veya müşteri desteği gibi farklı iş bölümlerine göre, bölümleme yapmamayı tercih eden Facebook, tüm proje geliştiricilerine bu verilere ulaşım izni veriyor.  Sosyal ağ, kullanıcı tarafından düşünüldüğünde rahatsız edici bir fikir gibi gözüken bu uygulamayı, istismar edilmesine karşı aldıkları çok çeşitli önlemler olduğunu ve bu konuda “sıfır tolerans politikası uyguladıklarını” söyleyerek savunuyor.

 

Yorumlar (1)