İstatistik, deneysel verileri toplamak, analiz etmek, yorumlamak ve sunmak için yöntemler geliştirmek ve incelemekle ilgili bilimdir. İstatistik, oldukça disiplinler arası bir alandır; istatistikte araştırma, hemen hemen tüm bilimsel alanlarda uygulanabilirlik bulur ve çeşitli bilimsel alanlardaki araştırma soruları, yeni istatistiksel yöntem ve teorilerin geliştirilmesini motive eder. Yöntem geliştirirken ve yöntemlerin altında yatan teoriyi incelerken istatistikçiler çeşitli matematiksel ve hesaplama araçlarından yararlanırlar.
İstatistik alanındaki iki temel fikir belirsizlik ve çeşitliliktir. Bilimde (veya daha genel olarak hayatta) karşılaştığımız ve sonucun belirsiz olduğu birçok durum vardır. Bazı durumlarda belirsizliğin nedeni, söz konusu sonucun henüz belirlenmemiş olmasıdır. Örneğin; “Yarın yağmur yağıp yağmayacağını bilemeyebiliriz”, diğer durumlarda ise belirsizlik, sonuç zaten belirlenmiş olmasına rağmen bunun farkında olmamamızdır. Örneğin; “Belirli bir sınavı geçip geçmediğimizi bilemeyebiliriz.”
Olasılık, belirsiz olayları tartışmak için kullanılan matematiksel bir dildir ve olasılık istatistikte önemli bir rol oynar. Herhangi bir ölçüm veya veri toplama çabası, bir dizi varyasyon kaynağına tabidir. Bununla, aynı ölçüm tekrarlanırsa cevabın muhtemelen değişeceğini kastediyoruz. İstatistikçiler, herhangi bir durumda varyasyon kaynaklarını (mümkün olduğunda) anlamaya ve kontrol etmeye çalışır.
Bazı istatistiksel önlemler şunları içerir:
- Regresyon Analizi
- Çarpıklık
- Basıklık
- Varyans
Bazı istatistiksel problem örnekleri ise şunlardır:
- Çevresel faktörlerle hastalığı ilişkilendiren kanıtların yorumlanması,
- İlaçların etkinliğini değerlendirmek için deney tasarımı,
- Popülasyondaki hedef segmentleri keşfetmek için madencilik verileri,
- Yeni bir ürüne olan talebi tahmin etmek için pazar araştırması,
- Siyasette kamuoyu yoklaması,
- Koruma için düzenlemelerin oluşturulmasına yardımcı olmak için bir hayvan popülasyonunun büyüklüğünün tahmin edilmesi,
- Garanti tespiti için güvenilirlik çalışmaları,
- Bir hizmetin veya üretilen bir ürünün kalitesinin iyileştirilmesi,
- Hava Durumu tahmini,
- Bilimsel deneylerdeki hataların analizi ve
- Borsa fiyatlarının tahmini.
İstatistikleri Anlamak
İstatistik, bir analistin bir veri setini karakterize etmek için kullandığı bir süreci özetlemek için kullanılan bir terimdir. Veri seti daha büyük bir popülasyonun bir örneğine bağlıysa, analist öncelikle örneklemden elde edilen istatistiksel sonuçlara dayanarak popülasyon hakkında yorumlar geliştirebilir. İstatistiksel analiz, verileri toplama ve değerlendirme ve ardından verileri matematiksel bir formda özetleme sürecini içerir.
İstatistik, psikoloji , işletme, fiziksel ve sosyal bilimler, beşeri bilimler, hükümet ve imalat gibi çeşitli disiplinlerde kullanılmaktadır . İstatistiksel veriler, örnek bir prosedür veya başka bir yöntem kullanılarak toplanır. Verilerin analizinde iki tür istatistiksel yöntem kullanılır: Tanımlayıcı İstatistikler ve Çıkarımsal İstatistikler. Tanımlayıcı İstatistikler, ortalama veya standart sapmayı kullanan bir numuneden alınan verileri özetlemek için kullanılır. Çıkarımsal İstatistikler ise, veriler belirli bir popülasyonun alt sınıfı olarak görüldüğünde kullanılır.
İstatistik Türleri
İstatistik genel ve geniş bir terimdir, bu nedenle bu şemsiyenin altında bir dizi farklı model olması doğaldır.
Regresyon Analizi
Regresyon Analizi, faiz oranları, bir ürün veya hizmetin fiyatı veya belirli endüstriler veya sektörler gibi belirli faktörlerin bir varlığın fiyat dalgalanmalarını ne ölçüde etkilediğini belirler. Bu, Doğrusal Regresyon adı verilen düz bir çizgi şeklinde tasvir edilmiştir.
Çarpıklık
Çarpıklık, bir dizi verinin bir dizi istatistiksel verideki standart dağılımdan farklılık derecesini tanımlar. Emtia getirileri ve hisse senedi fiyatları da dahil olmak üzere çoğu veri kümesinde ya pozitif eğri, veri ortalamasının soluna doğru eğimli bir eğri veya veri ortalamasının sağına doğru eğimli bir eğri olan negatif eğri vardır.
Basıklık
Basıklık, verilerin normal dağılıma göre hafif kuyruklu (aykırı değere daha az eğilimli) veya ağır (aykırı değere daha eğilimli) olup olmadığını ölçer. Yüksek basıklığa sahip veri kümeleri, yoğun kuyruklara veya aykırı değerlere sahiptir, bu da ara sıra vahşi getiriler şeklinde daha fazla yatırım riski anlamına gelir. Düşük basıklığa sahip veri kümelerinin kısa kuyrukları vardır veya aykırı değerler yoktur, bu da daha az yatırım riski anlamına gelir.
Varyans
Varyans, bir veri kümesindeki sayıların aralığının bir ölçüsüdür. Varyans, kümedeki her sayının ortalamaya olan mesafesini ölçer. Varyans, bir yatırımcının bir yatırım satın alırken kabul edebileceği riski belirlemeye yardımcı olabilir.
Amerikan İstatistik Derneği’ne göre, istatistiksel mesleklerdeki kişilerin iş özellikleri aşağıdaki faaliyetleri içerir:
- Çok çeşitli alanlardaki sorunları çözmek için verileri kullanmak,
- Matematiksel ve istatistiksel bilgileri sosyal, ekonomik, tıbbi, politik ve ekolojik problemlere uygulamak,
- Bireysel ve/veya disiplinler arası bir ekibin parçası olarak çalışmak,
- Diğer profesyonellere danışmak veya konferanslara, seminerlere ve sürekli eğitim faaliyetlerine katılmak için seyahat edin,
- Eğitim ve araştırma yoluyla istatistik ve olasılık sınırlarını ilerletin.
İstatistikler, Geçerli Sonuçlar Çıkarmak için Sayısal Kanıtlar Kullanırlar
İstatistikler sadece sayılardan ya da gerçekler değildir. Bilirsiniz ki, 5 diş hekiminden 4’ü belirli bir diş macununu tercih eder. Bunun yerine, verilerden güvenilir bir şekilde öğrenmenizi sağlayan bir dizi bilgi ve prosedürler vardır. İstatistikler, iddiaları nicel kanıtlara dayalı olarak değerlendirmenize izin verir ve makul hatta şüpheli sonuçları ayırt etmenize yardımcı olur. Bu özellik, bu günlerde özellikle hayati önem taşıyor. Çünkü veriler, motivasyonları bilinmeyen insanlar tarafından sunulan yorumlarla birlikte çok fazla olmaktadırlar.
İstatistikçiler, güvenilir analizler ve tahminler üretmede kritik rehberlik sunarlar. İstatistikçiler, araştırmacıların çok çeşitli analitik tuzaklardan kaçınmasına yardımcı olabilir.
Analistler, istatistiksel prosedürleri doğru kullandıklarında, doğru sonuçlar üretme eğilimindedirler. Gerçekte, istatistiksel analizler sonuçlarda belirsizlik ve hatayı hesaba katar. İstatistikçiler, güvenilir sonuçlar üretmek için bir çalışmanın tüm yönlerinin uygun yöntemleri takip etmesini sağlar. Bu yöntemler şunları içerir:
- Güvenilir veriler üretmek.
- Verilerin uygun şekilde analiz edilmesi.
- Makul sonuçlar çıkarmak.
İstatistikçiler Sık Karşılaşılan Tuzaklardan Nasıl Kaçınılacağını Biliyor
Bir çalışma için bulgular üretmek için istatistiksel analizleri kullanmak, uzun bir sürecin doruk noktasıdır. Bu süreç, çalışma tasarımını oluşturmayı, değişkenleri seçmeyi ve ölçmeyi, örnekleme tekniğini ve örneklem büyüklüğünü tasarlamayı , verileri temizlemeyi ve diğer birçok konu arasında analiz metodolojisini belirlemeyi içerir. Sonuçların genel kalitesi, tüm olaylar zincirine bağlıdır. Tek bir zayıf bağlantı güvenilmez sonuçlar doğurabilir. Aşağıdaki liste, bir çalışmayı etkileyebilecek olası sorunların ve analitik hataların küçük bir örneğini verebilir.
Önyargılı Örnekler: Yanlış çizilmiş bir örnek , sonuçları en baştan saptırabilir. Örneğin; bir çalışmada insan denekleri kullanılıyorsa, denekler, sonuçları etkileyecek şekilde denek olmayanlardan farklı olabilir.
Aşırı Genelleme: Bir popülasyondan elde edilen bulgular başka bir popülasyon için geçerli olmayabilir. Ne yazık ki, bir popülasyonu diğerinden neyin ayırdığı kesin değildir. İstatistiksel çıkarımlar her zaman sınırlıdır ve sınırlamaları anlamalısınız.
Nedensellik: X’in Y’de bir değişikliğe neden olduğunu nasıl belirlersiniz? İstatistikçiler nedenselliği varsaymak için sıkı standartlara ihtiyaç duyarken, diğerleri nedensel ilişkileri daha kolay kabul eder. A, B’den önce gelir ve A, B ile ilişkilendirildiğinde, birçok kişi yanlışlıkla bunun nedensel bir bağlantı olduğuna inanır! Ancak, sonuçların nedenselliği temsil ettiğinden emin olmak için rastgele atama içeren deneysel bir tasarım kullanmanız gerekir . Nedensellik mi yoksa korelasyon mu gözlemlediğinizi nasıl belirleyeceğinizi öğrenin!
Yanlış Analiz: Çok değişkenli bir çalışma alanını tek bir değişkenle mi analiz ediyorsunuz veya yetersiz bir değişken kümesi mi kullanıyorsunuz? Belki de medyan daha iyi olduğunda ortalamayı değerlendiriyorsunuz veya doğrusal olmayan verilere doğrusal bir ilişki mi uydurdunuz? Çok çeşitli analitik araçlar kullanabilirsiniz, ancak hepsi belirli bir durum için doğru değildir.
Bir Analiz İçin Varsayımların İhlal Edilmesi: Çoğu istatistiksel analizin varsayımları vardır. Bu varsayımlar genellikle örneklemin, değişkenlerin, verilerin ve modelin özelliklerini içerir. Karmaşıklığa ek olarak, belirli koşullar altında bazı varsayımlardan vazgeçebilirsiniz. Bazen merkezi limit teoremi sayesinde önemli bir varsayımı ihlal ettiğinizde, yanıltıcı sonuçlar üretme riskini alırsınız.
Veri madenciliği: Analistler diğer her şeyi doğru yaptığında bile, bir veri setini çok uzun süre araştırarak yanlış anlamlı sonuçlar üretebilirler. Analistler birçok test yaptığında, verilerdeki şans örüntüleri nedeniyle bazıları istatistiksel olarak önemli olacaktır. Titiz istatistikçiler, bir çalışma sırasında gerçekleştirilen testlerin sayısını izler ve sonuçları uygun bağlama yerleştirir.
Güvenilir sonuçlar üretmek için çok sayıda düşüncenin doğru olması gerekir. Ne yazık ki, analizleri bozmanın ve yanıltıcı sonuçlar üretmenin birçok yolu var. İstatistikçiler bu bataklıkta başkalarına rehberlik edebilir!
Alanınızda Etki Yaratmak İçin İstatistikleri Kullanın
İstatistiksel Analizler, neredeyse tüm alanlarda, mevcut olan büyük miktarda veriyi anlamlandırmak için kullanılır. İstatistik alanı birincil çalışma alanınız olmasa bile, seçtiğiniz alanda bir etki yaratmanıza yardımcı olabilir. Hem alanınızda yeni bulgular üretmek hem de başkalarının çalışmalarını anlamak için istatistiksel metodoloji hakkında çalışma bilgisine ihtiyacınız olma ihtimali çok yüksektir.
Tersine bir istatistikçi olarak, çok çeşitli alanlarda becerilerinize yüksek bir talep vardır: üniversiteler, araştırma laboratuvarları, hükümet, endüstri vb. Ayrıca, istatistiksel kariyerler genellikle oldukça iyi ödeme yapar. Son olarak İstatistiklerle ilgili en sevdiğim alıntılardan biri John Tukey’in yazdığı şu ifadeleri sizlerle paylaşmak isterim:
“İstatistikçi olmanın en iyi yanı, herkesin arka bahçesinde oynayabilmenizdir.”
Bir yanıt bırakın