Big Data & Hadoop Full Course - Learn Hadoop In 10 Hours | Hadoop Tutorial For Beginners | Edureka
جدول المحتويات:
إن مصطلح "البيانات" ليس جديدًا بالنسبة إلينا. إنها واحدة من الأشياء الأساسية التي يتم تدريسها عند اختيار تقنية المعلومات وأجهزة الكمبيوتر. إذا استطعت أن تتذكر ، تعتبر البيانات هي الشكل الخام للمعلومات. على الرغم من وجوده بالفعل منذ عقد من الزمن ، إلا أن المصطلح البيانات الكبيرة هو ضجة في هذه الأيام. وكما هو واضح من المصطلح ، فإن الأحمال ، وحمولات البيانات ، هي بيانات كبيرة ويمكن معالجتها بطرق مختلفة باستخدام طرق وأدوات مختلفة للحصول على المعلومات المطلوبة. تتناول هذه المقالة مفاهيم البيانات الكبيرة ، باستخدام 3 V التي ذكرها دوغ لاناي ، وهو رائد في مجال تخزين البيانات والذي يعتبر أنه قد بدأ مجال Infonomics (اقتصاديات المعلومات). > قبل المتابعة ، قد ترغب في قراءة مقالاتنا حول أساسيات البيانات الكبيرة واستخدام البيانات الكبيرة لفهم جوهرها. قد يضيفون إلى هذا المنشور لمزيد من التوضيح لمفاهيم البيانات الكبيرة.
البيانات الكبيرة 3 مقابل
البيانات ، في شكلها الضخم ، المتراكمة عبر وسائل مختلفة تم حفظها بشكل صحيح في قواعد بيانات مختلفة في وقت سابق وتم التخلص منها بعد مرور بعض الوقت. عندما ظهر المفهوم أنه كلما زادت البيانات ، أصبح من الأسهل اكتشاف - معلومات مختلفة وذات صلة - باستخدام الأدوات المناسبة ، بدأت الشركات في تخزين البيانات لفترات أطول. هذا يشبه إضافة أجهزة تخزين جديدة أو استخدام السحابة لتخزين البيانات بأي شكل تم شراء البيانات به: المستندات ، جداول البيانات ، قواعد البيانات ، HTML ، وما إلى ذلك. يتم ترتيبها في صيغ مناسبة باستخدام أدوات قادرة على معالجة أجزاء كبيرة من البيانات.
ملاحظة:
لا يقتصر نطاق البيانات الكبيرة على البيانات التي تجمعها وتخزنها في أماكن العمل والسحابة. يمكن أن يتضمن بيانات من مصادر أخرى مختلفة ، بما في ذلك على سبيل المثال لا الحصر ، العناصر الموجودة في النطاق العام. يستند النموذج الثلاثي الأبعاد للبيانات الكبيرة إلى العناصر التالية:
الحجم: يشير إلى إدارة تخزين البيانات
- السرعة: يشير إلى سرعة معالجة البيانات
- التنوع: يشير إلى تجميع البيانات لمجموعات بيانات مختلفة لا علاقة لها على ما يبدو
- تشرح الفقرات التالية نمذجة البيانات الكبيرة بالحديث عن كل بُعد (كل V) بالتفصيل.
أ] حجم البيانات الضخمة
يتحدث عن البيانات الكبيرة ، قد يفهم المرء حجمه كمجموعة ضخمة من المعلومات الخام. على الرغم من أن هذا صحيح ، إلا أنه يتعلق أيضًا بتكاليف تخزين البيانات. يمكن تخزين البيانات الهامة في المباني وكذلك على السحابة ، وهذا الأخير هو الخيار المرن. ولكن هل تحتاج إلى تخزين كل شيء؟
وفقا لورقة عمل أصدرتها مجموعة ميتا ، عندما يزداد حجم البيانات ، تبدأ أجزاء من البيانات في البحث عنها غير ضرورية. وعلاوة على ذلك ، تنص على أنه ينبغي الاحتفاظ بحجم البيانات هذا فقط الذي تنوي الشركات استخدامه. قد يتم تجاهل البيانات الأخرى أو إذا كانت الشركات مترددة في التخلي عن "البيانات المفترضة غير المهمة" ، فيمكن التخلص منها على أجهزة الكمبيوتر غير المستخدمة وحتى على الأشرطة حتى لا تضطر الشركات إلى دفع ثمن تخزين هذه البيانات. > استخدمت "البيانات المفترضة غير المفترضة" لأنني أعتقد أيضًا أن البيانات من أي نوع يمكن أن تطلبها أي شركة في المستقبل - عاجلاً أم آجلاً - وبالتالي يجب الاحتفاظ بها لفترة زمنية جيدة قبل أن تعرف أن البيانات في الواقع غير مهم. أنا شخصياً أقوم بتنزيل البيانات القديمة إلى الأقراص الثابتة من الأمساكيات وأحياناً على أقراص DVD. تحتوي أجهزة الكمبيوتر الرئيسية والتخزين السحابي على البيانات التي أراها مهمة وأعرف أنني سأستخدمها. ومن بين هذه البيانات أيضًا ، هناك نوع من الاستخدام مرة واحدة من البيانات قد ينتهي إلى محرك أقراص ثابتة قديم بعد بضع سنوات. المثال أعلاه هو فقط من أجل تفهمك. لن يناسب وصف البيانات الضخمة لأن المبلغ أقل بكثير مقارنة بما تعتبره الشركات بيانات كبيرة.
B
السرعة في البيانات الكبيرة
تعد سرعة معالجة البيانات عاملاً مهمًا عند الحديث عن مفاهيم البيانات الكبيرة. هناك العديد من المواقع ، لا سيما التجارة الإلكترونية. لقد اعترفت Google بالفعل بأن السرعة التي يكون فيها تحميل الصفحة ضروريًا للحصول على ترتيب أفضل. وبصرف النظر عن الترتيب ، توفر السرعة أيضًا الراحة للمستخدمين أثناء التسوق. وينطبق الشيء نفسه على البيانات التي تتم معالجتها للحصول على معلومات أخرى. أثناء الحديث عن السرعة ، من الضروري معرفة أنه يتجاوز عرض النطاق الترددي العالي فقط. فهو يجمع بين البيانات القابلة للاستخدام بسهولة مع أدوات التحليل المختلفة. البيانات سهلة الاستخدام تعني بعض الواجبات المنزلية لإنشاء هياكل البيانات التي يسهل معالجتها. البعد التالي - Variety ، ينتشر المزيد من الضوء على هذا.
C] مجموعة متنوعة من البيانات الكبيرة
عندما يكون هناك الكثير من البيانات والأحمال ، يصبح من المهم تنظيمها بطريقة تستطيع أدوات التحليل من خلالها بسهولة معالجة البيانات. هناك أدوات لتنظيم البيانات كذلك. عند التخزين ، يمكن أن تكون البيانات غير منظمة وأي شكل. الأمر متروك لك لمعرفة ما لديها من علاقة مع البيانات الأخرى معك. بمجرد معرفة العلاقة ، يمكنك التقاط الأدوات المناسبة وتحويل البيانات إلى النموذج المطلوب للتخزين المنظم والمفرز.
الملخص
وبعبارة أخرى ، يعتمد نموذج 3D للبيانات الكبيرة على ثلاثة أبعاد: بيانات USABLE التي تمتلكها وضع العلامات المناسبة للبيانات ؛ ومعالجة أسرع. إذا تم الاعتناء بهؤلاء الثلاثة ، فيمكن معالجة بياناتك أو تحليلها بسهولة لمعرفة ما تريد.
ما سبق يشرح المفهومين والنموذج الثلاثي الأبعاد للبيانات الكبيرة. ستثبت المقالات المرتبطة في الفقرة الثانية دعمًا إضافيًا إذا كنت جديدًا على المفهوم.
إذا كنت ترغب في إضافة أي شيء ، يرجى التعليق.
Study Pushes for Net Neutrality، New Journalism Models
A new study call for open internet rules and support for new models of journalism.
Blu-ray 3D، More TV Models Boosting 3D TV Shipments
شحنات التلفزيون 3D آخذة في الارتفاع ، مدفوعة بتوافر المزيد قالت شركة الأبحاث DisplaySearch يوم الأربعاء إن الطرز التلفزيونية والمحتوى الثلاثي الأبعاد
Kinect ، يتخطى XBOX ، هو The Big Big Thing!
الجميع يعرف الآن أن The Big Thing for the year بدا لكي تكون أبل مع الآيباد ، ولكن لنكن صادقين ، فإن Kinect قد خرجت فقط لمدة شهرين حتى الآن وقد أقلعت مثل نوع من العدوى الفيروسية واسعة الانتشار