Büyük Veri nedir? Giriş, Türler, Özellikler, Örnekler
Büyük Veriye girişe geçmeden önce şunları bilmeniz gerekir:
Veri nedir?
Elektrik sinyalleri şeklinde saklanabilen ve iletilebilen ve manyetik, optik veya mekanik kayıt ortamlarına kaydedilebilen, bilgisayar tarafından işlemlerin gerçekleştirildiği miktarlar, karakterler veya semboller.
Şimdi Büyük Veri tanımını öğrenelim
Büyük Veri nedir?
Büyük Veri , hacmi çok büyük olan, ancak zamanla katlanarak büyüyen bir veri topluluğudur. O kadar büyük boyutlu ve karmaşık bir veridir ki, geleneksel veri yönetim araçlarının hiçbiri onu depolayamaz veya verimli bir şekilde işleyemez. Büyük veri de bir veridir, ancak çok büyük boyuttadır.
Büyük Veri nedir?
Büyük Veri Örneği Nedir?
Aşağıda Büyük Veri örneklerinden bazıları verilmiştir-
New York Borsası hakkında üretir Büyük Verilerden bir örnektir bir terabayt günde yeni ticaret verileri.
Sosyal medya
İstatistik , her gün 500 terabayttan fazla yeni verinin sosyal medya sitesi Facebook'un veritabanlarına alındığını gösteriyor . Bu veriler esas olarak fotoğraf ve video yüklemeleri, mesaj alışverişleri, yorum koyma vb.
Tek bir Jet motoru , 30 dakikalık uçuş süresinde 10+ terabayt veri üretebilir . Günde binlerce uçuşla veri üretimi birçok Petabayta ulaşıyor .
Büyük Veri Türleri
Büyük Veri türleri şunlardır:
- yapılandırılmış
- yapılandırılmamış
- yarı yapılandırılmış
Yapılandırılmış Büyük Veri
Sabit formatta saklanabilen, erişilebilen ve işlenebilen herhangi bir veri, 'yapılandırılmış' veri olarak adlandırılır. Zaman içinde, bilgisayar bilimlerindeki yetenekler, bu tür verilerle (biçimin önceden iyi bilindiği durumlarda) çalışmak için teknikler geliştirmede ve ayrıca bundan değer elde etmede daha büyük başarılar elde etti. Bununla birlikte, günümüzde, bu tür verilerin boyutunun çok büyük ölçüde büyüdüğü, tipik boyutların birden fazla zettabayt öfkesinde olduğu sorunları öngörüyoruz.
Biliyor musunuz? 10 21 bayt için eşit 1 zettabayt veya bir milyar terabayt formları bir zettabayt .
Bu rakamlara bakıldığında, Büyük Veri adının neden verildiğini kolayca anlayabilir ve depolanması ve işlenmesiyle ilgili zorlukları hayal edebilirsiniz.
Biliyor musunuz? İlişkisel bir veritabanı yönetim sisteminde depolanan veriler, 'yapılandırılmış' verilerebir örnektir .
Yapılandırılmış Veri Örnekleri
Veritabanındaki bir 'Çalışan' tablosu, Yapılandırılmış Verilere bir örnektir
Çalışan kimliği | Çalışan Adı | Cinsiyet | Bölüm | Maaş_In_lacs |
---|---|---|---|---|
2365 | Rajesh Kulkarni | Erkek | finans | 650000 |
3398 | Pratibha Joshi | Dişi | yönetici | 650000 |
7465 | Şuşil Roy | Erkek | yönetici | 500000 |
7500 | Shubhojit Das | Erkek | finans | 500000 |
7699 | Priya Sane | Dişi | finans | 550000 |
Yapılandırılmamış Büyük Veri
Bilinmeyen form veya yapıya sahip herhangi bir veri, yapılandırılmamış veri olarak sınıflandırılır. Boyutlarının çok büyük olmasına ek olarak, yapılandırılmamış veriler, ondan değer elde etmek için işlenmesi açısından birçok zorluk doğurur. Yapılandırılmamış verilere tipik bir örnek, basit metin dosyaları, resimler, videolar vb.'nin bir kombinasyonunu içeren heterojen bir veri kaynağıdır. Günümüzde kuruluşlar, bunlarla ilgili çok sayıda veriye sahiptir, ancak ne yazık ki, bundan nasıl değer elde edeceklerini bilmiyorlar. bu veriler ham biçiminde veya yapılandırılmamış biçimindedir.
Yapılandırılmamış Veri Örnekleri
'Google Arama' tarafından döndürülen çıktı
Yapılandırılmamış Veri Örneği
Yarı Yapılandırılmış Büyük Veri
Yarı yapılandırılmış veriler, her iki veri biçimini de içerebilir. Yarı yapılandırılmış verileri formda yapılandırılmış olarak görebiliriz, ancak aslında ilişkisel VTYS'de örneğin bir tablo tanımı ile tanımlanmamıştır . Yarı yapılandırılmış veri örneği, bir XML dosyasında temsil edilen bir veridir.
Yarı Yapılandırılmış Veri Örnekleri
Bir XML dosyasında saklanan kişisel veriler-
<rec><name>Prashant Rao</name><sex>Erkek</sex><age>35</age></rec> <rec><name>Seema R.</name><sex>Kadın</sex><age>41</age></rec> <rec><name>Satish Mane</name><sex>Erkek</sex><age>29</age></rec> <rec><name>Subrato Roy</name><sex>Erkek</sex><age>26</age></rec> <rec><name>Yeremya J.</name><sex>Erkek</sex><age>35</age></rec>
Yıllara Göre Veri Büyümesi
Yıllara Göre Veri Büyümesi
Lütfen yapılandırılmamış olan web uygulama verilerinin günlük dosyalarından, işlem geçmişi dosyalarından vb. oluştuğunu unutmayın . OLTP sistemleri, verilerin ilişkilerde (tablolarda) depolandığı yapılandırılmış verilerle çalışmak üzere oluşturulmuştur.
Büyük Verinin Özellikleri
Büyük veri aşağıdaki özelliklerle tanımlanabilir:
- Ses
- Çeşitlilik
- Hız
- değişkenlik
(i) Hacim – Büyük Veri adının kendisi çok büyük bir boyutla ilgilidir. Verinin boyutu, verinin değerini belirlemede çok önemli bir rol oynar. Ayrıca, belirli bir verinin gerçekten Büyük Veri olarak kabul edilip edilemeyeceği, veri hacmine bağlıdır. Bu nedenle, 'Hacim' , Büyük Veri çözümleriyle uğraşırken dikkate alınması gereken bir özelliktir.
(ii) Çeşitlilik – Büyük Verinin bir sonraki yönü, çeşitliliğidir .
Çeşitlilik, hem yapılandırılmış hem de yapılandırılmamış heterojen kaynaklara ve verilerin doğasına atıfta bulunur. Daha önceki günlerde, elektronik tablolar ve veritabanları, uygulamaların çoğu tarafından dikkate alınan tek veri kaynağıydı. Günümüzde e-posta, fotoğraf, video, izleme cihazları, PDF'ler, ses vb. şeklindeki veriler de analiz uygulamalarında dikkate alınmaktadır. Bu yapılandırılmamış veri çeşitliliği, verilerin depolanması, madenciliği ve analizi için belirli sorunlar doğurur.
(iii) Hız - terimi 'hızı' verilerin oluşturulmasına hızını ifade eder. Verilerin talepleri karşılamak için ne kadar hızlı üretildiği ve işlendiği, verilerdeki gerçek potansiyeli belirler.
Büyük Veri Hızı, iş süreçleri, uygulama günlükleri, ağlar ve sosyal medya siteleri, sensörler, Mobil cihazlar vb. kaynaklardan gelen verilerin akış hızıyla ilgilenir . Veri akışı çok büyük ve süreklidir.
(iv) Değişkenlik – Bu, veriler tarafından zaman zaman gösterilebilen, dolayısıyla verileri etkili bir şekilde işleme ve yönetme sürecini engelleyen tutarsızlığı ifade eder.
Büyük Veri İşlemenin Avantajları
DBMS'de Büyük Verileri işleyebilme yeteneği, aşağıdakiler gibi birçok fayda sağlar:
- İşletmeler karar alırken dış istihbarattan yararlanabilir
Arama motorlarından ve facebook, twitter gibi sitelerden gelen sosyal verilere erişim, kuruluşların iş stratejilerine ince ayar yapmalarını sağlıyor.
- İyileştirilmiş müşteri hizmetleri
Geleneksel müşteri geri bildirim sistemlerinin yerini Büyük Veri teknolojileriyle tasarlanmış yeni sistemler alıyor. Bu yeni sistemlerde, tüketici tepkilerini okumak ve değerlendirmek için Büyük Veri ve doğal dil işleme teknolojileri kullanılmaktadır.
- Varsa ürün/hizmetlere yönelik riskin erken tespiti
- Daha iyi operasyonel verimlilik
Büyük Veri teknolojileri, veri ambarına hangi verilerin taşınması gerektiğini belirlemeden önce yeni veriler için bir hazırlık alanı veya iniş bölgesi oluşturmak için kullanılabilir . Ek olarak, Büyük Veri teknolojilerinin ve veri ambarının bu şekilde entegrasyonu, bir kuruluşun nadiren erişilen verileri boşaltmasına yardımcı olur.
Özetlersek
- Büyük Veri tanımı : Büyük Veri, boyutu çok büyük olan veri anlamına gelir. Büyük veri, boyut olarak çok büyük olan ve zamanla katlanarak büyüyen bir veri koleksiyonunu tanımlamak için kullanılan bir terimdir.
- Büyük Veri analizi örnekleri, borsaları, sosyal medya sitelerini, jet motorlarını vb. içerir.
- Büyük Veri 1) Yapılandırılmış, 2) Yapılandırılmamış, 3) Yarı Yapılandırılmış olabilir
- Hacim, Çeşitlilik, Hız ve Değişkenlik, Büyük Veri özelliklerinden birkaçıdır
- İyileştirilmiş müşteri hizmetleri, daha iyi operasyonel verimlilik, Daha İyi Karar Verme, Bigdata'nın birkaç avantajıdır.