Car-tech

Cloudera Preps Hadoop for the Enterprise

Michiaki Ariga 有賀, Cloudera, Big Data Analytics Tokyo 2017

Michiaki Ariga 有賀, Cloudera, Big Data Analytics Tokyo 2017
Anonim

Cloudera كشف عن مجموعة جديدة من أدوات إدارة Hadoop ، وتسمى Cloudera Enterprise وأعلنت الشركة يوم الثلاثاء أن الشركة ستقدم رسوم اشتراك سنوية. كما قامت بتحديث مجموعة التوزيع المفتوحة المصدر الخاصة بها Hadoop.

كل من الإصدارات الجديدة ، بالإضافة إلى العديد من الشراكات الجديدة مع مزودي بائعي برامج إدارة البيانات ، تظهر الشركة تستعد لتقديم تكنولوجيا قاعدة البيانات الناشئة - الآن تستخدم في الغالب من قبل عمالقة الويب مثل غوغل وياهو - إلى سوق الشركات كبديل لقواعد البيانات العلائقية.

"رهاننا ليس فقط شركات الويب الكبيرة ، ولكن البنوك والمستشفيات وشركات التأمين ستكتشف أنها بحاجة إلى تحليل معقدة وهيكلة البيانات جنبا إلى جنب ، وقدمت Hadoop لذلك "، وقال الرئيس التنفيذي لشركة كلوديرا مايك أولسون. "Hadoop يحل مشكلة جديدة ، بطريقة جديدة."

واحدة من عدد متزايد من قواعد البيانات غير SQL ، أو NoSQL ، يستند Hadoop الخروج من Google MapReduce ، وهو إطار لمعالجة البيانات بالتوازي عبر أعداد كبيرة من الكمبيوتر العقد. تقدم Hadoop ، التي يتم تطويرها الآن كمشروع مفتوح المصدر من قبل Apache Software Foundation ، بديلاً لقواعد البيانات التقليدية ، على الأقل تلك الحالات لتحليل مجموعات البيانات الكبيرة التي تتغير بسرعة.

يمكنها العمل مع كل من SQL وغير بيانات -SQL ، وأكثر قدرة على مقاومة فشل الخادم من قواعد البيانات العلائقية ، قال أولسون.

تقوم كلوديرا بتعبئة Hadoop للمنظمات ذات المستوى المتوسط ​​، سواء بتوزيع Hadoop ، ومجموعة أدوات الإدارة التي تم إصدارها حديثًا. وقال أولسون إن الحزمتين ستسمحان للمنظمات التي ليس لديها الكثير من الخبرة التقنية المتعمقة في Hadoop بتشغيل البرنامج. وقال أولسون: "هناك أسطورة أن Hadoop قابلة للاستخدام إذا كانت لديك بيانات مقاسة من Google. هناك العديد من المستخدمين الذين لديهم فقط بضعة تيرابايت من البيانات التي يرغبون في تحليلها".

Cloudera Distribution for Hadoop (CDH) is حزمة مفتوحة المصدر من برامج برمجية مدمجة مسبقًا تم بناؤها حول Hadoop Common ، والتي كانت تُعرف سابقًا باسم Hadoop Core. تتضمن الحزمة: Hive ، الذي يوفر بنية تحتية لمستودع البيانات ؛ HBase ، وقاعدة البيانات التي تستند Hadoop. خنزير ، مترجم لبرامج خفض الخريطة ؛ Zookeper ، جدولة لتشغيل التطبيقات عبر خوادم متعددة ، و MapReduce.

في الإصدار الثالث ، تتضمن الحزمة ثلاثة برامج أطلقتها الشركة كمشروعات مفتوحة المصدر ، تحت رخصة Apache V2 مفتوحة المصدر. واحد هو Flume ، والتي يمكن أن تساعد في تحميل البيانات في Hadoop. إضافة جديدة أخرى هي Oozie ، وهو برنامج لإدارة سير العمل. والأخير هو كود Hadoop User Environment (HUE) ، الذي يوفر واجهة مستخدم لإدارة Hadoop.

"يسمح HUE لأي شخص ببناء تطبيقات تستهدف المحللين. إنه يعرف كيف يتحدث إلى مجموعات Hadoop" ، قال Olson.

تزيد حزمة Cloudera Enterprise الإصدار 3 من CDH مع أدوات إدارة إضافية. يسمح هذا البرنامج الجديد ، الذي ليس مفتوح المصدر ، للمسؤولين بالتحكم في إدارة الوصول من خلال استخدام بروتوكول الوصول لتغيير بيانات الدليل. كما يتم توفير برامج لموارد التزويد ، للقيام بالتشخيص ومراقبة الأداء.

لن يناقش أولسون كم دفعت كلوديدا من رسوم الاشتراك والاستشارة حتى الآن ، لكنها تشير إلى أن الربع الأول من عام 2010 ، قدمت الشركة بقدر ما ما حققه خلال نصف عام 2009. ومن بين الصناعات المختلفة ، أبدت شركات الخدمات المالية والاتصالات والبيع بالتجزئة والحكومة وشركات التجارة عبر الإنترنت اهتمامًا بالتكنولوجيا ، حسب قول أولسون.

"إن الأشياء التي تقوم بها الشركات مع Hadoop تختلف." عموما ، هؤلاء الناس يمسكون بالكثير من البيانات من الكثير من الأماكن ويحتاجون إلى إخضاعها لتحليلات متطورة ، "قال أولسون. "تهتم الخدمات المالية باستخدام Hadoop للكشف عن الاحتيال. في مجال الاتصالات ، هناك حاجة حقيقية لتحسين الشبكات وخفض العملاء."

بالإضافة إلى تقديم هذه الحزم ، كانت Cloudera تحشد الدعم لـ Hadoop من مزودي ذكاء الأعمال (BI) وبرامج إدارة البيانات.

تخطط أولسون للإعلان ، خلال حديثه في قمة Hadoop 2010 ، التي ستعقد في سانتا كلارا ، في ولاية كاليفورنيا يوم الثلاثاء ، ستدعم شركة MicroStrategy لبطاقات BI استخدام Hadoop.

شريك جديد آخر هو Talend ، وهو بائع برامج تكامل البيانات مفتوحة المصدر. قامت الشركة بتوسيع جناح تالند للتكامل مع قواعد بيانات Hadoop. يتيح جناحه للمسؤولين إدارة وتجميع مصادر بيانات متعددة من وحدة تحكم واحدة. مع Hadoop ، يمكن للبرنامج "إدراج البيانات أو استردادها ، ومعالجة البيانات داخل هيكل Hadoop" ، وقال نائب الرئيس Talend للتسويق ، Yves de Montcheuil.

Microstrategy و Talend الانضمام إلى عدد متزايد من الشركات تستعد مفتوحة المصدر أو أدوات الإدارة التجارية لشركة Hadoop. في الأسبوع الماضي ، شرعت كلوديرا و كويست في مشروع لبناء برنامج يمكنه ربط Hadoop بقواعد بيانات Oracle. في مايو ، أعلنت شركة Pentaho لمعلومات المخابرات العامة المفتوحة أن مجموعة BI ستعمل مع قواعد بيانات Hadoop

في مقابلة منفصلة مع IDG News Service ، أشارت شركة Yahoo CTO Raymie Stata إلى أن Hadoop قد تقلل من الحاجة إلى بناء أجهزة الكمبيوتر العملاقة لتحليل مجموعات البيانات الكبيرة. تقليديا ، تم نقل مجموعات كبيرة من البيانات من التخزين إلى الكمبيوتر العملاق ، وهي مجموعة مجمعة من الخوادم ، لتحليلها. في المقابل ، يقوم Hadoop بتحويل الحساب التحليلي إلى حيث تتواجد البيانات ، مما يلغي الحاجة إلى آلة الطحن المركزي العملاقة. كانت ياهو من أوائل المساهمين الرائدين في Hadoop.

بالإضافة إلى عرض Cloudera ، يتم أيضًا تسويق Hadoop بواسطة IBM ، والتي بدأت مؤخرًا في تقديم مجموعة من الخدمات التحليلية التي تستخدم هذه التقنية.

Joab Jackson يغطي برنامج enterpise والعامة أخبار التكنولوجيا العاجلة لـ The IDG News Service. اتبع Joab على تويتر علىJoab_Jackson. عنوان البريد الإلكتروني لـ Joab هو [email protected]