摘要
农作物空间分布信息是支撑相关科学研究与政策制定的重要依据。当前农作物空间分布遥感分类在理论和技术方法方面取得了长足的发展,但仍面临一些难题,包括地面样本数据的获取困难、作物特征选择存在主观性和冗余、特征构建过程中缺乏针对性和代表性等,导致农作物空间分布遥感分类的效率与精度不足。
针对这些问题,文章开展快速、准确、低成本的样本获取、特定作物分类的最优特征构建与优选,并分别选择多个研究区开展实证研究。样本获取方面,开发基于“视田”众包的样本获取平台,通过迭代更新的任务采集和历史样本库的方式高效获取地面样本。作物分类方面,提出遗传规划算法为不同作物提取差异化的特征,通过遗传进化思想实现定制化特征的构建,能够在原始特征的基础上构建高层次特征。
在北方地区,利用“视田”众包工具,由8名工作人员2天内完成了位于义县、辽中区、新民市及开原市4个区域的水稻、玉米、大豆和花生的样本采集,内业工作人员同步进行分类并迭代样本需求,分类的总体精度均大于90%,kappa系数均高于0.87。在南方地区,位于湖北省枝江市区域的春秋两季作物分类结果的总体精度均大于94%,kappa系数均高于0.86。
农作物空间分布信息是农作物长势监测、产量估测和灾害评估的重要基础,也是区域农作物种植结构优化调整、水土资源管理和政府宏观决策的重要支撑。遥感因其覆盖范围大、高效及时以及低成本等优点,被广泛应用于农作物空间分布信息提取研究中,为快速、准确获取大区域的农作物空间分布提供了全新的技术手
作物样本是分析农作物在遥感图像不同波段光谱亮度、空间结构特征的重要输入,其质量、数量以及空间布设直接影响分类效果。作物生长季内,地面观测数量不足、农作物类型不全时有发生,特别是在农作物早期识别中,训练样本的缺失使农作物遥感分类受阻。传统的农作物地面样本采集主要通过实地调研的方法,利用全球定位系统定位,实地记录农作物空间位置信息和农作物类别信息,其优势是可以准确地获得研究区域内较为详细的农作物信息,缺点是需要耗费较多人力、物力和财力,难以实现大区域尺度的样本采集。如美国、加拿大和欧洲等国家和地区已经实现了大区域尺度农作物“一张图”,其中美国农田统计数据(Cropland Data Layer,CDL)产品以高达95%的精度实现国家全覆盖;年度作物清单也可以覆盖加拿大南部的六大省份且精度超过85
特征是农作物遥感分类的重要基础,目前分类器的设计已经相对成熟,当前工作的重点是特征提取策略研
研究区域选择了我国南北方种植类型不同的辽宁省和湖北省共5个区域,其中辽宁省包括4个小区(

图1 研究区区位
Fig.1 Location map of the study area
影像数据来源于哨兵2号(Sentinel-2)高分辨率多光谱成像卫星,其携带一枚多光谱成像仪(MultiSpectral Instrument,MSI),用于陆地监测,可提供植被、土壤和水覆盖、内陆水路及海岸区域等图像。
北方地区,该文基于Google Earth Engine(GEE)平台筛选出2020年4—11月义县、新民市、辽中区、开原市4个区域云量较少的哨兵2号影像共28幅,然后选择临近日期的影像进行镶嵌处理,每个地区处理后得到间隔约为1个月的影像集。南方地区,选出枝江市2020年5—10月的哨兵2号可用影像共计5景,用于研究区水稻、玉米的分类;2020年10月至2021年6月可用影像共计7景,用于研究区小麦、油菜的分类;柑橘为多年生作物,故采用整年的影像进行分类。
为解决样本获取和特征构建问题,提出了基于众包数据采集和遗传规划定制化特征构建的农作物遥感分类方法,主要包括样本获取、作物分类两个部分(

图2 总体技术路线
Fig.2 Overall technology roadmap
实时、准确、精细获取农田信息是加快推动农业信息化管理的基础,但由于农田信息变化快、时空差异大,传统技术手段很难满足信息获取需求。“视田”通过众包的手段,成本低廉、操作简单,为农田信息采集提供全新解决思路,主要包括两个功能模块。
(1)网页端(

图3 “视田”网页端发布任务(左)及APP端采集样本(右)
Fig.3 Publishing tasks on the web (left) and samples collected on the “Shitian” APP (right)

图4 遥感影像数据加载
Fig.4 Remote sensing data overlay
(2)移动端(即基于智能手机的农田信息采集APP,
为快速完成样点采集工作,通过非监督分类对研究区域作物分布空间异质性进行计算并成比例生成采集任务点,将生成的任务点通过“视田”众包平台网页端进行发布(

图5 辽宁区域地面样本在“视田”中的空间分布
Fig.5 Spatial distribution of ground samples in the “Shitian” in Liaoning region
对于湖北区域,利用“视田”的历史样本库中存有2021年潜江市和仙桃市水稻、小麦、油菜和玉米共120个样本点,以及2019年广西的839个柑橘样本点,根据作物光谱、时相及纹理特征,完成样本的时空迁移。最终,柑橘、玉米、油菜、水稻、小麦分别获得50个、137个、27个、52个、100个样本点,其他类(水体、林地、建筑、其他作物)约700个。
植被指数可以综合植被在不同波段的反射特性,很好地反映作物的生长状况,因而被广泛地应用于农作物分类和长势监测中。通过对遥感影像不同波段进行线性组合,得到的植被指数能反映不同作物生物物理特性的差异,增强农作物信息的特征表达。选用9个常用的植被指数和7个纹理特征(
定制化特征即针对不同作物构建差异化的特征,使用所有的作物特征进行作物多分类。由于作物间的物候历较为相似,“同物异谱”和“同谱异物”现象严重,同质性的作物特征并不能有效区分相似作物,对此定制化特征具有较大的潜力。遗传规划算法可以实现定制化特征的构建,其基本思想是仿效自然界中生物遗传和进化的过程,随机产生一个适合给定环境的初始种群,种群中的每个个体都代表问题的一个解决方

图6 遗传规划算法的进化流程
Fig.6 Evolutionary process of genetic programming algorithm
迭代上述过程,直到得到问题的最优解或者达到最大迭代次数,其得到的新特征具有一定可解释性和可视化。遗传规划算法能够在原始特征的基础上构建高层次特征,改善分类效果,并且可以可视化特征进化的过程,具有一定的可解释性,针对不同的作物分别构建遗传规划算法特征,最后一起输入随机森林实现作物的多分类。
(1) |

图7 开原市区域大豆遗传规划算法特征
Fig.7 Features of genetic programming algorithm for soybeansin the autumn of 2020 in Kaiyuan region
如

图8 作物分类方法流程
Fig.8 Flow chart of crop classification method
以湖北区域为例的分层作物提取流程如下:①基于水体、建筑物、道路等非耕地样本,结合遗传规划算法自动提取的特征,进行第一次分类得到研究区内非耕地掩膜,以排除非耕地像素对作物提取的干扰,生成耕地图层;②通过时空迁移收集柑橘样本,并采用全年时间序列的影像,结合遗传规划算法在耕地区域内提取柑橘,并制作柑橘掩摸,生成下一步待分类区域;③经由前两步掩摸提取后生成待分类区域,在其中进行剩余两种农作物的分类。通过时空迁移收集样本,结合遗传规划算法完成分类。居民区的行道树是干扰柑橘分类的一类典型植物,通过先一步提取居住区再掩膜之后,很好地改善了将行道树错分成柑橘的情况。
获得作物分布图后,对分类结果进行面向对象的后处理。使用10 m分辨率的Sentinel-2影像进行多尺度分割,以生成的地块边界为基准过滤分类结果,排除掉了分类结果中存在的异常点,使得田块的边界更为清晰规整。处理后的结果更符合实际情况,有助于提升分类精度。
基于样本点和时序遥感影像,利用遗传规划算法自动构建作物的定制化特征,依照分层提取策略,分别对义县、辽中区、新民市及开原市4个区域的水稻、玉米、大豆、花生进行分类,结果如

图9 辽宁省区域作物分类
Fig.9 Liaoning regional crop classification
注: “-”代表该区域无对应作物
从分类结果看(
基于样本点和时序遥感影像,利用遗传规划算法自动构建作物的定制化特征,依照分层提取策略,对枝江市研究区的柑橘、油菜、小麦、水稻、玉米进行分类。结合当地轮作情况,制作不同时相的分类结果图两张(

图10 湖北区域作物分类。a. 2020年秋季,b. 2021年春季
Fig.10 Classification results in Hubei region of autumn crops in 2020 and spring crops in 2021
注: “-”代表该区域无对应作物
农作物特征获取是农作物分类的关键,传统算法对特定区域的作物特征获取有较好的表现。但由于南北方气候、种植结构、种植类型等的较大差异,使得传统算法难以迁移。为了验证方法的可靠性,以辽宁省开原市研究区为例,该文设计了3组对照试验,对比了多时相和单时相两个情景来验证研究算法的优势。①将哨兵2号时间序列数据中的10个原始光谱波段作为特征,输入随机森林分类器中进行分类;②将哨兵2号时间序列数据的10个原始光谱波段作为特征输入遗传规划算法中,通过进化计算筛选出20个遗传规划特征,将20个遗传规划特征输入到随机森林分类器中进行分类;③将光谱特征、植被指数、纹理特征一并输入到随机森林分类器中进行分类。
在影像充足的情况下,研究收集了作物生长季中所有可用的影像进行农作物分类,3组试验的结果如
卫星数据的质量受到天气影响的制约,对于指定的研究区域很有可能无法获取到足量的卫星数据用于遥感分类研究,因此在数据时相不足时的分类表现至关重要。此外,即使在数据量充足的地区,减少数据的使用量也能够显著的节约计算成本和资源消耗。因此提出一种在少时相数据下稳定表现的农作物分类方法具有重要意义。研究以辽宁开原市为例,对比了基于遗传规划的农作物自动分类方案在不同时相数据的稳定性。
计算不同特征可分离性指数的平均值进行排序(
该文针对目前农作物遥感分类中样本数据获取困难和作物特征选择存在主观性和冗余性的问题。提出了基于“视田”众包的样本获取方案,可通过迭代更新的任务采集和历史样本库的方式高效获取地面样本。提出的遗传规划算法可为不同作物提取差异化的特征,通过对原始影像进行自动学习,能够在原始特征的基础上构建高层次特征。通过在南北方5种不同作物种植类型的研究区域的实验表明,该文方案一方面可以提高分类方法的普适性和分类精度,另一方面在可用数据丰富和匮乏的情况下,都能有较为稳定的优秀表现。
参考文献
刘杰,刘吉凯,安晶晶,等. 基于时序Landsat 8 OLI多特征与随机森林算法的作物精细分类研究. 干旱地区农业研究,2020,38(3):281-288. [百度学术]
郑长春,王秀珍,黄敬峰. 多时相MODIS影像的浙江省水稻种植面积信息提取方法研究. 浙江大学学报(农业与生命科学版),2009,35(1):98-104. [百度学术]
彭光雄,宫阿都,崔伟宏,等. 多时相影像的典型区农作物识别分类方法对比研究. 地球信息科学学报,2009,11(2):225-230. [百度学术]
Qiu Bingwen,Luo Yuhan,Tang Zhenghong,et al. Winter wheat mapping combining variations before and after estimated heading dates. Isprs Journal of Photogrammetry and Remote Sensing,2017,123:35-46. [百度学术]
Zhang Ce,Sargent Isabel,Pan Xin,et al. Joint Deep Learning for land cover and land use classification. Remote Sensing of Environment,2019,221:173-187. [百度学术]
Zhong Liheng,Hu Lina,Zhou Hang. Deep learning based multi-temporal crop classification. Remote Sensing of Environment,2019,221:430-443. [百度学术]
Shi Hanyu,Xiao Zhiqiang,Liang Shunlin,et al. Consistent estimation of multiple parameters from MODIS top of atmosphere reflectance data using a coupled soil-canopy-atmosphere radiative transfer model. Remote Sensing of Environment,2016,184:40-57. [百度学术]
Rouse J,Haas R,Schell J,et al. Monitoring vegetation systems in the great plains with ERTS. NASA Special Publication,1974,1. [百度学术]
VanDeventer A P,Ward A D,Gowda P H,et al. Using thematic mapper data to identify contrasting soil plains and tillage practices. Photogrammetric Engineering and Remote Sensing,1997,63(1):87-93. [百度学术]
Qi Jiaguo,Marsett R,Heilman Philip,et al. RANGES improves satellite-based information and land cover assessments in Southwest United States. Eos,Transactions American Geophysical Union,2002,83. [百度学术]
Xiao X M,Boles S,Liu J Y,et al. Characterization of forest types in Northeastern China,using multi-temporal SPOT-4 VEGETATION sensor data. Remote Sensing of Environment,2002,82(2-3):335-348. [百度学术]
Huete A,Didan K,Miura T,et al. Overview of the radiometric and biophysical performance of the MODIS vegetation indices. Remote Sensing of Environment,2003,83(1-2):195-213. [百度学术]
Xiao Chiwei,Li Peng,Feng Zhiming,et al. Sentinel-2 red-edge spectral indices (RESI) suitability for mapping rubber boom in Luang Namtha Province,northern Lao PDR. International Journal of Applied Earth Observation and Geoinformation,2020,93. [百度学术]
Gitelson A,Merzlyak M N. Spectral reflectance changes associated with autumn senescence of Aesculus hippocastanum L. and Acer platanoides L. leaves. Spectral features and relation to chlorophyll estimation. Journal of Plant Physiology,1994,143(3):286-292. [百度学术]
Wang Cong,Chen Jin,Wu Jin,et al. A snow-free vegetation index for improved monitoring of vegetation spring green-up date in deciduous ecosystems. Remote Sensing of Environment,2017,196:1-12. [百度学术]
Koza J. Genetic Programming: On the Programming of Computers by Means of Natural Selection (Complex Adaptive Systems). MIT Press,1992. [百度学术]