《遥感学报》
摘要:随着现代科技的快速发展,自动化和信息化成为技术应用的主要特征,遥感技术作为大数据背景下获取数据资源的重要途径,其在社会经济发展中的应用也越来越广泛。随着遥感技术的不断创新,其获取的数据在规模上不断扩大,在类型上逐渐多元,而这必然会对大数据的自动分析与挖掘提出更高的要求。基于此,本文从遥感大数据的内容出发,对数据自动分析和挖掘技术进行简要分析,以探索我国遥感大数据的发展方向。
关键词:遥感大数据;自动分析;数据挖掘
1遥感大数据
近年来在计算机技术和网络技术不断深入发展的背景下,在虚拟空间中生成的数据规模也不断扩大,社交平台、搜索引擎、电商平台、移动APP、安全监控、卫星检测等系统都在不停地产生数据,据国际数据咨询公司预测,到2020年全球数据总量将达到40ZB,这一庞大的数据规模是难以想象的,而其中蕴藏的应用价值也是不可估量的。遥感大数据是大数据资源的重要构成,随着人类探索空间的拓展,利用卫星技术实现对地观测已经成为资源探索、城市规划、地形观测等工作的必然要求,利用遥感卫星技术实现对数据的生成与收集则是遥感大数据形成的关键。与普通的大数据特征一致,遥感大数据包括卫星在对地观测中形成的不同成像方式、不同波段和分辨率的数据信息,这些信息绝大部分并不具备单一的分析价值,但是在数据达到一定规模后,其分析价值也会呈基数增长。
从目前我国遥感大数据的自动分析与挖掘情况来看,其数据应用技术的发展难以与数据生成规模相符。例如传感器的设计依然停留在单一阶段,缺乏对多元遥感数据的筛选与判断,从数据到数据的传播,使得大数据的知识内容十分稀薄,同时不断扩大的数据规模,浪费了一定的存储空间,影响了数据的开发与运用。在大数据分析中,数据的应用价值不仅仅在于规模大,还在于类型全,对于遥感大数据而言,高密度、多时相、全方位、多层次的数据类型能够全面反映隐藏在数据背后的地理学、社会学、管理学等信息,而对这些深层次信息的挖掘,就是遥感大数据自动分析技术与挖掘技术突破瓶颈,实现科学研究应用价值的关键。
2遥感大数据自动分析
自动分析是遥感大数据进行挖掘、实现数据向知识转化的前提,因此,建立统一、紧凑、语义清晰的自动分析系统,能够为后续的遥感大数据挖掘与利用打好基础。遥感大数据自动分析系统的构建可以从以下几个方面分析:
第一,数据表达。随着遥感技术的发展,在数据生成中,其包含的语义信息更加丰富而多元,传统的数据表达方式已经难以实现对遥感大数据的准确解读,因此,在数据自动生成系统构建中,技术人员应做好表达方式的设计。例如在地理观测中,技术人员可以高内聚同意地理位置在不同粒度、不同方位、不同时相在不同观测空间的投影,来对已经生成的遥感大数据进行表达,进而为地理学研究提供光谱、纹理、结构等方面信息,提高遥感数据分析在地理检测中的作用。
第二,数据检索。网络化与集成化是遥感大数据发展的必然趋势,利用互联网技术实现对遥感大数据的整合与利用,并通过检索功能为用户提供针对性信息则是数据挖掘的基本目标。例如在当前城市规划中,遥感大数据已经应用到行政区域划分、交通网络构建、水分信息观测、空气质量监测等方面;用户通过登录界面,能够根据关键词触发检索系统,而在智能检索中,系统利用图片、文字信息,对相似性的数据内容进行对比,并反馈到用户检索页面,进而生成可视性的数据模型,提高遥感大数据自动分析价值。
第三,数据理解。在实现遥感大数据向具体知识转化的过程中,语义理解上的鸿沟需要弥合,目前在遥感大数据的自动分析过程中,数据尤其是底层数据与知识生成之间几乎是“风马牛不相及”,这使得数据挖掘中目标识别难以实现,知识的形成自然受到限制。针对此,在遥感大数据的理解系统构建中,技术人员一方面要将数据特征、分析目标、识别场景等信息进行一体化处理,以强化遥感大数据的语义理解;另一方面还要做好多元数据分析,基于多途径、多场景、多尺度的原则实现多元语义的输出。
第四,数据云系统。在遥感大数据应用中,基于数据系统建立的云服务平台,能够为用户提供一体化的地球空间服务资源,例如我们日常生活中常用的电子地图,就是基于遥感大数据形成的云平台,用户可以直接定位地点,而遥感技术通过对地观测数据系统生成相关的地理数据,并完成GPS定位、导航等服务。
3遥感大数据的挖掘
数据挖掘就是指利用科学严谨的算法,从大量数据中搜索隐藏于其中的信息的过程。在遥感大数据挖据中,技术人员可以利用C4.5、K-means、SV