Simba (Spatial In-Memory Big data Analytics)是基于spark环境和运行在集群的应用平台,它继承并扩展了spark的容错机制,simba在spark基础上对RDD建立索引,尤其对空间数据的操作进行了优化.

simba增加了spark SQL查询分析器的空间关键字和语法,使用户可以表达类似SQL语句的查询空间,特别是simba扩展了SQL spark引擎,支持通过双方丰富的空间查询、分析SQL和数据帧API.最后,simba实现了有效的查询优化器,它利用了其索引和新颖的空间感知优化功能,同时也实现了低延迟和高吞吐量。