加入收藏 | 设为首页 | 会员中心 | 我要投稿 东莞站长网 (https://www.0769zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

HPE大数据商业白皮书 | 大数据分析给OEM软件开发商带来巨大发展

发布时间:2021-03-05 12:46:53 所属栏目:大数据 来源:网络整理
导读:我们都知道:大数据的崛起不可逆转;迎接这一趋势才能驾驭未来。 IDC最新的预测表明,大数据技术市场将以26.4%的年复合增长率增长,到2018年将达到415亿美元——大约相当于整体信息技术市场增长率的六倍。此外,IDC相信,到2020年,业务部门采购者会将数据分
副标题[/!--empirenews.page--]

我们都知道:大数据的崛起不可逆转;迎接这一趋势才能驾驭未来。

IDC最新的预测表明,大数据技术市场将以26.4%的年复合增长率增长,到2018年将达到415亿美元——大约相当于整体信息技术市场增长率的六倍。此外,IDC相信,到2020年,业务部门采购者会将数据分析推向其习惯使用的关系数据库(性能管理)之外,扩展到实时情报和非结构化环境的探索/发现,实现两位数的增长。

为对这种不可思议的数据规模、增长速度和多样性进行管理,多项新技术应运而生。由于新近创建的数据在本质上大部分(超过80%)均为非结构化数据,因此大数据分析技术需要综合考虑“已知”和“未知”情形,以前所未有的方式交付价值。从数据变现到客户挽留,到合规性再到流量优化,采用此新兴技术的企业正在改变每个纵向市场中业务的动态情况。


OEM软件供应商的商机


所有这一切为OEM软件供应商带来了巨大商机。您可以通过创建分析数据管理功能或全新的应用,来帮助客户更快进行更明智的数据驱动型决策,从而获得利润。

随着企业发现各种新方法来从数据中创造收益,传统事务处理式、内存密集型和基本的分析平台开始变得难以应对。您的客户希望得到能够实现如下目标的分析OEM软件平台:

  • 管理海量数据:选定的数据库应能够以最低的成本提供无限的规模。现在,规模可能达数 GB 或数 TB;将来,规模可能达数PB 甚至更高。

  • 提供快速分析:软件供应商应提供足够高的加载和查询性能,以确保分析的及时性和相关性。解决方案应提供各种方法来优化常见查询;它应足够灵活,以便可运行临时查询。

  • 嵌入式机器学习:嵌入式计算机学习算法至关重要。以迭代方式从新数据中学习的分析平台会使软件解决方案具备全新水平的独特智能。

  • 处理用户定义功能(UDx):能够通过分析平台接口连接到数百个应用、数据源、ETL和图表化模块,这也同样至关重要。对于无法现成连接到的目标,则可通过UDx轻松集成。对于期待增加功能多样性和改善对其核心产品的数据见解的软件供应商来说,UDx是一个明显的差异化优势。

  • 为数据科学家提供支持:新类型的数据科学家采用诸如Java、Python和R等工具来创建预测式分析。数据科学家所欣赏的分析平台是,其所提供的工具有助于看清趋势、发现异常,并未雨绸缪。

  • 使用高级分析:许多平台均可分析单个表或执行简单的查询,但是极少有平台能够分析多年间来自大量源的数十个表以及数百个数据类型、维度和属性。

  • 需要极少管理:企业已经习惯于通过手动管理数据库来实现最佳性能。新的模式是,分析平台无需繁杂监管即可调整和管理备份和接口。


HPE Vertica:应对最严苛的大数据挑战


HPE Vertica是专为满足大数据分析的独特需求而全新构建的分析平台。凭借其大规模并行处理系统,它能够处理PB级数据,这一点已经在多个行业中的一些要求极为严苛的使用案例中得到了印证。由于采用列存储,而且对数据进行压缩,因此数据库可用有限的占用空间提供超快的分析,查询时间可从数小时缩短至数分钟或从数分钟缩短至数秒钟,且所需内存和磁盘只是原来的零头。

HPE Vertica的每个版本都通过了可与图表化工具和ETL工具配合使用的认证和测试。HPE Vertica分布式Python和R功能提供非常高效的API,为新一代数据科学家提供有力支持。最后,HPE Vertica不仅仅是一个数据库,它还提供了基于SQL的高级分析,包括图形分析、三角计数和蒙特卡罗模拟及地理空间分析等。它是一个完整功能的分析平台。

HPE Vertica:一个完整功能分析平台

该平台的核心是专门用来处理当今大数据分析工作负载的列式关系数据库。与数十年前为支持小规模数据量而设计的商用和开源行存储不同,Vertica可为软件供应商及其客户提供:

  • 基于SQL的全面高级分析功能,可执行强大的大数据分析

  • 群集式数据存储,可提供卓越的查询和分析性能

  • 更好的压缩性能,与同类解决方案相比,所需硬件和存储更少

  • 足够的灵活性和可扩展能力,可在工作负载增加时轻松扩容

  • 更高的负载吞吐量,以及更好的查询并发性能

  • 通过Python、R和Spark进行预测式分析的解决方案

  • 更少的数据库管理员(DBA)干预,减少了管理开销和调优操作

  • 能够以流式、连续少量和批量方式输入数据

  • 文本日志搜索

(编辑:东莞站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!