SAP предлагает средство эффективной обработки и анализа больших массивов данных в реальном времени
31 октября 2012 г., Нью-Йорк. — SAP AG (NYSE: SAP) объявила об интеграции Apache Hadoop в системы хранилищ данных реального времени, предложив новое комплексное решение для обработки «больших данных» и стратегию вывода на рынок в альянсе с компаниями Cloudera, Hitachi Data Systems, Hortonworks, HP и IBM. Продукт базируется на флагманской платформе SAP HANA® и включает в себя сервер SAP® Sybase® IQ, ПО SAP® Data Integrator и средства бизнес-аналитики SAP® BusinessObjects™. Это всеобъемлющее решение для анализа больших массивов накопленных данных в реальном времени, поступающих из разнообразных источников.
В сферах, где некогда традиционные СУБД доминировали над корпоративными системами аналитических хранилищ данных, Hadoop набирает популярность среди компаний, нуждающихся в эффективных и доступных средствах хранения и обработки данных, объем которых постоянно увеличивается. При этом компаниям необходима интеграция Hadoop с их бизнес-аналитическими системами и налаженными процедурами работы с хранилищами данных. Комплексное решение для обработки «больших данных», подкрепленное альянсами с вендорами Hadoop по выводу на рынок, дает клиентам SAP законченную стратегию аналитической обработки данных в хранилищах. Эта стратегия сочетает потенциал Hadoop со скоростью, свойственной обработке баз данных в оперативной памяти и поколоночной организации данных.
Компания Mitsui Knowledge Industry, специализирующаяся на биоинформатике и геномном анализе, создала аналитическую базу данных реального времени, в которой на базе SAP HANA реализуются сложные алгоритмы итеративных расчетов геномных последовательностей, при этом предварительная обработка данных выполняется в Hadoop. Такое решение позволило сократить время анализа генома с нескольких дней до нескольких минут. Всемирный лидер в области исследований цифрового пространства компания comScore с помощью Hadoop обрабатывает терабайты данных каждый день. Результаты загружаются в корпоративное хранилище данных SAP Sybase IQ, где становятся доступны для анализа тысячам клиентов comScore с помощью средств самообслуживания.
«Наша задача — помочь организациям построить высокопроизводительное корпоративное хранилище данных, сочетающее мощь анализа в реальном времени с инфраструктурой обработки Hadoop, — сказал Стив Лукас (Steve Lucas), глобальный исполнительный вице-президент и генеральный менеджер подразделения «Database and Technology» фирмы SAP. — Благодаря новым средствам обработки „больших данных“, выдающим результаты с беспрецедентной быстротой, клиенты могут выявлять и измерять недоступные ранее информационные сигналы в самых разных источниках данных, получая и используя важнейшую бизнес-информацию».
Совмещая скорость, масштаб, гибкость и доступность, необходимые для полного использования потенциала больших массивов данных, SAP предлагает следующие решения, интегрированные с Hadoop — как в едином пакете, так и по отдельности:
Клиенты SAP могут включить Hadoop в свои системы бизнес-аналитики и хранилищ данных разными способами, проведя интеграцию сообразно потребностям. С помощью SAP Data Integrator можно считывать данные из распределенных файловых систем Hadoop (HDFS) или баз данных Hive и выборочно загружать их в SAP HANA или SAP Sybase IQ, так что пользователи бизнес-аналитических систем гарантированно смогут использовать для работы с данными свои привычные средства аналитики и отчетности. Кроме того, можно выдавать федеративные запросы к совокупности систем SAP Sybase IQ и Hadoop environments, либо же запускать задачи MapReduce в среде массово-параллельной обработки SAP Sybase IQ, используя встроенную функциональность. Наконец, пользователи SAP BusinessObjects BI могут выдавать запросы к системе Hive — таким образом, бизнес-аналитики получают возможность работать со системой Hadoop непосредственно.
SAP в альянсе с основными поставщиками Hadoop-сервисов и услуг поддержки
Чтобы упростить организациям задачу создания решений по обработке больших массивов данных, в которых используется платформа SAP для обработки данных в реальном времени и Hadoop, члены организованного SAP партнерского альянса в сотрудничестве друг с другом разрабатывают рыночные стратегии и налаживают организованное взаимодействие с клиентами. Являясь ведущими поставщиками программ, систем и сервисов управления данными на базе Hadoop, а также образовательных услуг, компании Cloudera, Hitachi Data Systems, Hortonworks, HP и IBM помогут клиентам SAP быстро развернуть решения по обработке больших массивов данных, сочетающие обработку баз данных в реальном времени и Hadoop. С отзывами участников альянса можно ознакомиться здесь: Quote Sheet: 'Big Data' Bundle from SAP.
Дополнительные сведения опубликованы на сайте SAP Newsroom.
© Copyright 2016, ООО "Сайбейс"