Veri Toplama



Original Source Here

Veri biliminin en önemli konularından biri verilerin toplanmasıdır. Verileri toplamak zahmetli ve maliyetli bir süreçtir. Bu işlem yürütülürken bazı hususlara önemle dikkat edilmesi gerekir;

  1. Verinin nereden alındığı
  2. Ne kadar hata içerebileceği
  3. Toplayan kişinin yanlılığı

Verinin nereden alındığı

Verinin nereden alınacağı konusunda eğer araştırma konumuz internet kullanıcılarını pek ilgilendiren bir konu değil ise fiziksel anket yapmamız daha doğru olur. Bunun için de yazılımlar geliştiren firmalar olup kağıda yazılan anketler bilgisayarlara direkt okutulabilmektedir. Fakat eğer bilgisayar ortamında bir anket yapılacaksa işimiz daha kolay. Bunun için Google Forms yazılımını kullanabiliriz. Kullanımı da oldukça kolay olduğu için 30 dakikada anketinizi hazır duruma getirebilirsiniz.

İnternet ortamında hazırladığımız anketlerin yayılmasını ve doğru kitlelere ulaşmasını sağlamak için Facebook grupları, Whatsapp grupları, Twitter gibi sosyal medya platformlarını kullanabiliriz. Fakat burada yanlış girilen cevaplar için dikkat edilmesi gerekiyor ve buna karşı bir önlem alınması gerekiyor. Çünkü ankete ulaşmak ve doldurmak çok kolay olduğundan rastgele veri giren kişiler de çok olacaktır.

Veriyi başka bir kaynaktan da (kitap, internet sitesi, makale) çekebiliriz. Buradaki dezavantaj ise veriyi başka biri topladığından hata içerebilmesi, yanlılık içermesi vs. Bu yüzden mümkünse veriyi kendimiz birinci elden almak daha mantıklı bir yaklaşım olacaktır.

Ne kadar hata içerebileceği

Anketlere rastgele veya yanlış değerlerin girilmesinin önüne geçmek zor olabilir. Bunu tespit edip düzeltmek yerine baştan önlenmesi bize zaman kazandıracaktır. Bu yüzden anketi paylaştığımız yerlerde uyarı metinleri bırakarak ve veriyi topladığımız grubun hedef kitlemiz olduğundan emin olarak bunun üstesinden gelebiliriz.

Toplayan kişinin yanlılığı

Toplamayı yapan kişinin kendi düşüncesine göre verileri şekillendirmesi de verinin saflığı ve temizliği için tehlikeli bir diğer durumdur. Bunu önlemek için veri toplama kanallarının çoğaltılması ve değişik kanallardan sağlanması gerekir.

AI/ML

Trending AI/ML Article Identified & Digested via Granola by Ramsey Elbasheer; a Machine-Driven RSS Bot

%d bloggers like this: