Anormaller, veri grafiği görsel olarak incelenerek grafiksel olarak tanımlanabilir. Bunlar aynı zamanda z-puanı veya standartlaştırılmış kalıntı gibi bir istatistiksel sapma ölçüsü hesaplanarak sayısal olarak da tanımlanabilir.
Bir veri kümesinde anormalliklerin varlığı, istatistiksel analizin sonuçları üzerinde etkiye sahip olabilir ve veri analizini yürütürken bunların potansiyel etkilerini dikkate almak önemlidir. Bazı durumlarda, anormallerin analizden önce veri kümesinden çıkarılması gerekebilir, diğer durumlarda ise bunlar değerli bilgi noktaları olarak alıkonulabilir.
Anormallerin bazı yaygın örnekleri şunlardır:
* Öğrenci test puanlarından oluşan bir veri setinde, anormal derecede yüksek bir puan kopya çekmeden kaynaklanıyor olabilir; anormal derecede düşük bir puan ise öğrencinin sınava hazırlanmadığını gösterebilir.
* Satış rakamlarından oluşan bir veri setinde, anormal derecede yüksek bir satış, özel bir promosyon veya tek seferlik bir satıştan kaynaklanabilirken, anormal derecede düşük bir satış, zor durumda olan bir mağazanın göstergesi olabilir.
* Tıbbi veri veri setinde anormal derecede yüksek veya düşük okuma, daha fazla araştırma gerektiren tıbbi bir duruma işaret edebilir.
Tüm anormallerin hataların veya olağandışı gözlemlerin sonucu olmadığını unutmamak önemlidir. Bazı durumlarda anormallikler, altta yatan popülasyondaki meşru değişikliklerden kaynaklanabilir. Örneğin, hisse senedi fiyatlarından oluşan bir veri setinde, anormal derecede yüksek bir fiyat, olumlu bir kazanç raporundan kaynaklanabilirken, anormal derecede düşük bir fiyat, kötü bir haberden kaynaklanabilir.
Bu nedenle, önemleri hakkında herhangi bir sonuca varmadan önce anormalleri dikkatlice araştırmak önemlidir.