时空数据库系列(二)时空数据库介绍 了解数据模型与应用场景

系列文章链接
时空数据库系列(一)什么是时空数据?特征和适用场景有哪些?
时空数据库系列(三)技术讲解:时空轨迹数据压缩、空间索引R-tree
时空数据库系列(四)如何高效存储、分析时空数据?时空数据库Spacture给了我们答案
时空数据库系列(五)星环时空数据库Spacture案例与Demo演示

为什么需要时空数据库?

在上一篇文章中,我们着重介绍了一下时空数据的特性及分类,并了解到时空数据在日常生活中普遍存在同时有着重要的认知意义。传感器网络、移动互联网、射频识别、全球定位系统等设备时刻输出时间和空间数据,数据量增长非常迅速,大量的时空数据被收集和产生,需要更加高效地存储、管理和分析。传统的关系型数据库已经无法满足处理这些数据的需求,因此时空数据库应运而生。

 

时空数据库介绍

时空数据库是空间数据库和时间数据库的延伸,其同时体现了空间、时间的概念,捕获数据的空间和时间方面,并处理几何形状随时间变化的位置。时空数据库能够存储、管理包括时间序列以及空间地理位置相关的数据。时空数据库具有时空数据模型、时空索引和时空算子,兼容SQL及SQL/MM标准,支持时空数据同业务数据一体化存储,易于集成使用。基于统一的时空参考与位置直接或间接相关联的大数据,具有位置、属性、时间、尺度、分辨率、多样性、异构性、多维性、价值隐含性、快速性等特性。

 

时空数据库具有处理典型的时空数据类型的能力,包括时空矢量数据与时空轨迹数据等。同时,时空数据库具备高并发百万级时空数据的写入,采用高压缩比低成本存储,实现对海量时空数据的存储、计算和分析,并具有插值、多维聚合计算、可视化查询结果等功能,可以应用在交通物流、城市管理、位置服务等多种时空数据分析场景下。

 

时空数据库与传统数据库不同的是,它提供了额外的与时空数据相关的功能和数据类型,例如点、线、面等空间对象及其与时间序列复合的数据类型。此外,时空数据库还支持空间查询和时空查询,例如常见的缓冲区查询,使得用户可以在时空范围内进行查询和分析。 这种数据库可以对时空数据进行高效的存储、查询、更新和分析。

 

时空数据库特征有哪些?

时空数据库除具有一般数据库的特征外,还具有6个特征。

1)位置特征。支持点、线、面、体等二维或三维(X,Y,Z)的几何对象数据,同时可具有复杂的拓扑关系、方向关系和精确的度量关系。

2)时间特征。时空大数据是随时间的推移而变化的,位置在变化,属性也在变化(如航母在海上航行、普通公路变成了高速公路)。

3)属性特征。点、线、面、体目标都有自己的质量、数量特征(如居民地的行政等级、人口数据、历史文化意义等等)。

4)尺度(分辨率)特征。尺度是空间大数据的主要特征之一。尺度效应普遍存在:一是,简单比例尺变化(缩放)所造成的地理信息表达效应;二是,不同的比例尺地图上经过制图综合后不同详细程度的表示;三是,对于不同采样粒度呈现的空间格局和描述的细节层次不同;四是,对地理信息进行分析时由于采用的数据单元不同而引起的悖论,即可塑性面积单元问题。

5)多源异构特征。一是数据来源的多样性,基本上为非结构化数据;二是地理空间信息的多源异构性(空间基准不同、时间不同、尺度不同、语义不一致),为结构化数据。

6)多维动态可视化特征。指所有来源的随时间变化的情报数据都可以与三维地理空间信息融合,并实现动态可视化。

 

时空数据库常用名词

  • 度量Metric)监测数据的指标,例如风力和温度。
  • 数据点Data points):针对监测对象的某项指标(由度量和标签定义)按一定的时间间隔(连续的时间戳)采集的每个度量值就是一个数据点。
  • 时间戳Timestamp):数据点的产生的时间点。
  • 字段Field):度量下的不同字段,比如位置这个度量包括空间XYZ坐标,同时空间坐标与时间戳相关。换言之,是需要随着时间变化而变化的数据。
  • 标签Tag):附加信息。存放的是并不随时间变化而变化的属性信息,如移动对象的固有属性。
  • 聚合 Aggregation):当同一个度量(Metric)的查询有多条时间线产生(多个指标采集设备),那么为了将空间的多维数据展现为成同一条时间线,需要进行合并计算。
  • 降采样Downsampling):当查询的时间区间跨度较长而原始数据时间精度较细时,为了满足业务需求的场景、提升查询效率,就会降低数据的查询及可视化精度,这就叫做降采样。
  • 数据时效Datas Validity Period):数据时效是设置的数据的实际有效期,超过有效期的数据会被自动释放。


时空数据库中的数据模型有哪些?

  • 矢量数据模型:矢量数据模型,也称为离散对象模型,是采用离散对象来表示地球表面的空间要素的。矢量数据结构是利用点,线,面等几何对象来表示简单的空间要素,具有定位明显,属性隐含的特点。


 


  • 栅格数据模型:栅格数据是由按照行和列组织的像元组成的,每一个像元的像元值都表示地物或现象的属性数据。格栅数据可以是航片、卫星影像、DEM等等。因此栅格数据有属性明显,定位隐含的特点。栅格非常适合用来表达那些沿地表连续变化的数据,比如说使用栅格化数据的DEM来记录一个区域的地形变化。当然我们也可以将降雨量、温度、密度和人口密度等连续变化的信息,使用栅格的形式来表达。


     

 


  • 空间轨迹数据:轨迹作为一种时空数据,指的是移动目标在空间中的移动路径,通常表示为空间位置点的序列,一般情况下移动目标的空间位置以经纬度的方式来表示。例如tr=<p1→p2→…pn>,其中点pi=(lat,lng,t),表示该物体在t时刻位于地理坐标位置(lat,lng)上,lat和lng分别表示纬度和经度。


 


时空数
型应用场景

时空数据库具有广泛的应用场景,主要涵盖以下几个方面:


  • 交通运输领域时空数据库可以应用于公路、铁路、航空等交通模式的时空分析和智能调度,如交通拥堵预测、路况优化、航班调度等。通过轨迹数据分析来深入理解交通路况特征和拥堵的演化模式,综合运用历史事件、时空、活动、天气等多维信息,辅助构建数据驱动的城市交通指挥体系。
  • 城市规划和管理时空数据库可以应用于城市规划、交通规划、城市公共服务等领域,通过分析城市的时空数据,提高城市运营效率和公共服务水平,如交通热点、城市人流分析、公共设施布局等。
  • 地理信息系统时空数据库可作为地理信息系统的基础数据平台,可以支持GIS软件的时空分析和可视化,如地图制作、地理理论分析、地理资源管理等。
  • 物流供应链管理时空数据库可以应用于物流、供应链及零售等领域,对库存、运输和销售等流程进行时空化监测和分析,如物流节点优化、供应链可视化管理。
  • 其他领域时空数据库在农业、环保、旅游等领域也有着广泛的应用,如农业生产优化、环境监测、旅游服务等。


 

时空数据库目前面临的问题?

在存储管理方面,以往集中式存储严重依赖单机性能,极大限制了存储能力的可扩展性,无法支撑海量非结构化数据低延迟存取高并发访问。在处理分析方面,以往串行分析算法已无法满足海量时空数据的实时处理需求,不能充分发挥当前新型硬件构架和并行模型/框架的优势。在数据挖掘方面,传统的数据挖掘算法大多是基于常规数据集实现,推广到TB级别甚至是PB级别数据时,其计算效率低、扩展性能差的不足就会显现。

 

机遇与挑战

作为新兴数据库产品,时空数据库在发展中机遇与挑战并存。一方面是时空数据量和类型的丰富,弥补了数据缺乏的不足,能够在最大程度上满足各类研究的需求,进一步推动交叉研究的不断深入;另一方面是面对时空大数据时空特征的特殊性,时空对象、事件等要素的动态演化以及相互间的动态关联关系对数据管理和分析带来了极大的挑战。

 

为满足广大用户对时空数据库对海量时空数据的存储、查询和分析需求,星环科技推出自主研发的分布式时空数据库Transwarp Spacture。其支持大规模矢量数据、时空轨迹数据、栅格瓦片数据的存储与计算,具有完备的数据查询、分析和挖掘能力。并通过成熟、先进的MPP架构支撑海量时空大数据存储管理,更好地服务于用户对空间数据的分析需求。

评论
登录后可评论
发布者
星小环分享号
文章
193
问答
243
关注者
27
banner
关注星环科技
获取最新活动资讯

加入TDH社区版技术交流群

获取更多技术支持 ->

扫描二维码,立即加入