数据仓库方案
数据仓库是为决策支持系统和联机分析应用提供面向主题的集成的结构化数据环境。通常,单机关系型数据库无法承载大数据量下数据仓库的建设,性能与扩展性存在瓶颈;并且传统的Hadoop架构在资源隔离、批量计算、SQL兼容性、分布式事务、存储过程等能力上存在缺陷,满足不了数据仓库建设的要求。TDH社区版配备了统一的SQL引擎可以帮助用户操作各类数据源,并且提供的inceptor组件批处理性能可以进行线性扩展,实现TPC-DS的性能要优于开源的Hive、Spark,综合性能对比同类产品提升了45%,可以为业务数据的存储和计算带来更高的性能以及更高的稳定性。通过社区版,企业用户可以更好地对分析型业务进行统一支撑,辅助进行业务决策的制定。
此外,社区版还支持分布式事务处理的操作,针对事务处理提供完整的ACID支持,Inceptor组件实现了串行化的事务隔离,并通过两阶段锁和MVCC 协议保证了数据的强一致性。
湖仓一体方案
传统的数据库普遍无法处理非结构化数据,以及实现数据湖,数据平台的功能与性能也不满足数仓场景,因此数据湖和数据仓库需要分开建设。在架构链路冗长、复杂的情况下,数据导入导出很容易出现不一致等情况,那么平台的建设、运维与维护成本则比较高。并且他们通常存在存储和计算的瓶颈,各类结构化、半结构化与非结构化数据无法得到很好地统一存储以及统一管理。
TDH社区版通过一体化多模数据库架构打破了传统的Hadoop+MPP混合架构,实现了湖仓技术架构统一,数据免搬迁。通过采用统一的架构,缩短链路,最大程度的避免了混合架构带来的复杂度。数据无需进行导入导出,充分增加了资源的复用性,降低了用户的开发运维成本,保证了湖仓数据流转和关联的无缝体验。
除了行业应用开发商可以借助社区版进行企业级大数据平台与大数据行业的应用探索以外,企业用户,高校与科研机构也可以通过社区版平台建设大数据教学科研平台,进行大数据技术人才的培养。个人爱好者可以通过社区版钻研领先大数据技术进行组件知识/技术的学习与研究。
如果您希望寻求一个易上手易管理易使用低成本的大数据管理平台,社区版TDH将是您的不二选择。
相关资源: