المكونات

Aster Data Updates 'frontline' Analytic Database

Sri Raghavan, Teradata | DataWorks Summit 2017

Sri Raghavan, Teradata | DataWorks Summit 2017
Anonim

Startup Aster Data Systems أصدرت النسخة 3.0 من قاعدة بياناتها التحليلية nCluster يوم الثلاثاء ، مما جعلها مثالية كمستودع بيانات "الخط الأمامي".

"بشكل تقليدي ، نفكر في تخزين البيانات كمهمة مكتب خلفي ،" كتب ماينكا باوا الرئيس التنفيذي لشركة أستر في مدونة بعد الثلاثاء. "يمكن تحميل مستودع البيانات في نوافذ تحميل منفصلة ؛ يمكن تشغيل الأحمال في وقت متأخر (التأثير الصافي هو أن المستخدمين التجاريين سيحصلون على تقاريرهم متأخرة) ؛ الأحمال والنسخ الاحتياطي والتوسيع يمكن أن تأخذ مستودعات البيانات دون اتصال - وهو موافق يمكن القيام بهذه المهام في ساعات غير تجارية (ليالي / عطلات نهاية الأسبوع). "

ولكن عملاء آستر ، الذين يشملون aCerno ، شبكة لإيصال الإعلانات عبر الإنترنت ،" يعتمدون على تحليلات البيانات لإيراداتهم "، قال باوا. ينتشر nster من 3.0 aster 's عبء العمل على عدد من الخوادم ويجعل من السهل إضافة أجهزة إضافية لمزيد من الطاقة. يقوم البرنامج أيضًا بتقسيم المكونات المختلفة لتحليل بيانات العمل إلى أجزاء منفصلة.

يتعامل المستوى "محمل" مع تحميل البيانات وتصديرها من وإلى المصادر الخارجية ؛ طبقة "عامل" بتخزين البيانات على الأقراص المرفقة محليًا للاستعلام؛ وطبقة من العقد "الملكة" تقوم بتخطيط الاستعلام الذكي ومعالجته.

وفي الوقت نفسه ، يعمل المستخدمون مع المجموعة كما لو كانت كيانًا واحدًا.

القدرة على تحديد الشرائح على نطاق انتقائي من الكتلة يعني أنه يمكن للمستخدمين إضافة الموارد في المناطق الأكثر حاجة إليها ، يقول أستر.

إلى هذه القدرات الأساسية ، يضيف الإصدار 3.0 عددًا من الوظائف للاستخدام "دائم التشغيل" ، بما في ذلك القدرة على إضافة السعة وإعادة توازن البيانات واستعادة البيانات أثناء النظام يعمل بشكلٍ مباشر.

عملت Aster أيضًا لإضافة موازٍ في جميع أنحاء النظام ، وفقًا لمسؤول في الشركة.

"نريد إنشاء أنظمة يمكنها التعامل مع بيانات أكبر بـ10x ، 100x أكثر من أي نظام آخر اليوم. لكن هذا أيضًا "الكثير من البيانات عن أي خادم سلعة واحدة" ، وقال CTO تاسو Argyros في بلوق وظيفة. "لذلك ، فإننا نضع الكثير من جهود البحث والتطوير في موازاة كل وظيفة من وظائف النظام - ليس فقط بالاستعلام ، ولكن أيضًا التحميل ، وتصدير البيانات ، والنسخ الاحتياطي ، والترقيات. علاوة على ذلك ، نسمح لمستخدمينا باختيار مقدار ما يريدون موازاة كل هذه الوظائف ، دون الحاجة إلى رفع مستوى النظام بأكمله. "

يتضمن الإصدار أيضًا دعمًا لـ MapReduce ، وهو أسلوب برمجة تم تطويره في الأصل بواسطة Google ، مما يسهّل على المطورين كتابة برامج لتحليل مجموعات كبيرة من البيانات. كما أعلنت شركة Greenplum منافسة Aster مؤخرًا دعم MapReduce.

تشتمل الميزات الإضافية على القدرة على تحديد مستويات ضغط البيانات للجداول الفردية ، وأداة ترقية "بنقرة واحدة" ؛ وميزات أمان أفضل ، مثل LDAP (بروتوكول الوصول الخفيف إلى الدليل) للمصادقة والقدرة على إدارة امتيازات المستخدم على مستوى المجموعة وقاعدة البيانات ومستويات الجدول.

العديد من عملاء Aster الأوليين ، الذين يتضمنون أيضًا MySpace ، يركزون على الويب قال كيرت موناش ، رئيس شركة موناش للأبحاث:

"إن وجود جزء هائل من النمو والفرص في تخزين البيانات يكمن في التعامل مع أنواع جديدة نسبيا من البيانات". "هناك مستودعات كبيرة للبيانات تتعامل مع OLTP التقليدي ، بيانات المعاملات ، لكن Aster ليس بالضرورة منافسًا رائدًا في تحليل ذلك. إن البقعة الحلوة في تحليل كميات كبيرة من البيانات هي بيانات الويب وأحداث الشبكة المرتبطة بها."

Monash cited إدارة المعالجة المتوازية ودعم MapReduce باعتبارها نقاط القوة الرئيسية في Aster: "Aster هي شركة ناشئة مع منتج غير ناضج نسبياً ، ولكنها وضعت الكثير من التفكير في كيفية جعل المعالجة المتوازية سهلة الإدارة."

يتم تشغيل 3.0 NCluster على خوادم x86 القياسية. يعتمد التسعير على مقدار البيانات التي تتم إدارتها. وقالت الشركة في السابق أن التكاليف تبدأ من 100000 دولار أمريكي.