Coding and Paper Letter(七十八)

新一期资源整理。

1 Coding:

1.R语言包tinyProject,R语言用户的轻量级数据分析框架。

tinyProject

2.全球变化评估模型(Global Change Assessment Model, GCAM)的共享经济路径(Shareing Socioeconomic Pathway, SSP)情景结果。

ssp data

3.线性网络上点过程的非齐次高阶汇总统计量。

Linear J function

4.本教程使用QGIS 3为没有制图经验的初学者教授桌面制图软件的基础知识。

Intro to Desktop GIS with QGIS

5.R语言包simr,通过蒙特卡洛模拟对广义线性混合模型进行功率分析。

simr

6.用R做统计与混合效应模型研讨会幻灯片与材料。

mixed model workshop 2day

7.该网站向您显示经过验证的冠状病毒患者的下落。数据由卫生部发布。

israelcoronamap

8.新冠病毒感染地图。

virus

9.COVID-19追踪项目。

website

10.COVID-19病例的数据库,包括胸部x光或CT图像。

covid chestxray dataset

11.不幸的是,丹麦气象研究所(DMI)尚未提供官方API。该软件包(以某种形式)是解决该问题的方法。 它从DMI官方网站收集所有天气数据(预报和存档),并将其转换为结构化数据对象。

dmi

12.周六Neuchatel 2020演示的幻灯片

satRday neuchatel 2020

13.R语言包ggimg,用ggplot2绘制图像数据。

ggimg

14.ACL 2019论文“Multi-hop Reading Comprehension through Question Decomposition and Rescoring”的原始实现。

DecompRC

15.终端仿真器中的彩色R输出。

colorout

16.R语言包easierRstations,使用本地交互式地图,轻松选择全球天气观测站或BOM气象站。

easieRstations

17.R语言包shinyMobile,Shiny IOS/Androdid的API接口。

shinyMobile

18.高光谱影像的深度学习分类器综述论文代码。

hyperspectral deeplearning review

19.这个存储库保存了运行以色列徒步地图站点所需的文件。

Site

20.学习深度学习的notebook。

dlaicourse

21.COVID-19传染病医院影响模型。

chime

22.苏格兰covid19测试结果。

Scot covid19

23.R语言包sfx,“sf”包的额外函数补充。

sfx

24.VectorSQL是一个面向物联网和大数据的免费分析数据库管理系统,与ClickHouse兼容。

vectorsql

25.用Tensorflow构建的模型和示例。

models

26.ACL 2017会议论文 “Get To The Point: Summarization with Pointer-Generator Networks”的代码。

pointer generator

27.Bob 是一款 Mac 端翻译软件,支持划词翻译和截图翻译,当然,手动输入进行翻译也是可以的。

Bob

28.杂项会谈和小型项目。

bbmisc

29.PostGIS的docker镜像。

docker postgis

30.在GemPy中用于构建模型的notebook集合。

notebooks

31.《The Rules of Contagion: Why Things Spread - and Why They Stop》书的代码。

rules of contagion

32.R语言包rstatix,R中的基本统计测试的管道化友好框架。

rstatix

33.地理/空间数据科学、地理信息系统和统计学教学资源。

Teaching Links

34.GeoDa Center的几个关于疫情的网站。

mapcovid19.github.io

geodacovid19.github.io

covid

35.深层神经网络库。

mkl dnn

36.R语言包future,在R中统一并行和分布式处理的工具。

future

37.Yoda是一个基于GPU参数指标的 Kubernetes 调度器。

Yoda Scheduler

38.展示用Here XYZ制作的网络地图。

xyz showcase

39.TiDB文档,有英文和中文两种版本。

docs tidb operator

40.CityGML 3.0概念模型的编码。

CityGML 3.0Encodings

41.冠状病毒的论文探索数据集。

cord 19

42.学习R资源。

learning R

43.桌面视频屏幕截图。

screen recorder

44.R语言包ggnomics,ggnomics将开始更加专注于基因组学任务。

ggnomics

45.R语言分析COVID-19数据。具体内容还不是很清楚,但从源码看有考虑用NDVI和夜间灯光数据。

fl covid19

46.佛罗里达卫生部提供的的佛罗里达COVID-19疫情数据。

covid19 florida

47.美国环保局年度用户会议R简介。

intro r workshop

48.利物浦大学地理数据科学实验室人员必须了解的一些基础知识。

the knowledge

49.德国COVID19确诊病例API。

covid api

50.R语言包pollen,处理空气生物学数据的工具。

pollen

51.复旦大学学位论文的Latex模板。

fduthesis

52.基于SEIR模型和R0估计的COVID-19传染病预测。

YijunWang

53.Parflow是一个开源的并行流域流模型。

parflow

54.统一接口,用于表达ffmpeg和canvas的视频流。

vider renderer

55.矢量场的eof(经验正交函数分析)计算(含U、V分量的风)。

eof

56.世界上所有138,398个城市,人口至少1000人,在一个大的JSON数据中。

all the cities

57.将约翰霍普金斯大学的COVID-19数据转化为json数据的API接口。

covid 19 api

58.一个基于 electron 的音乐软件。

lx music desktop

59.R语言包analogues,允许根据网格气候数据计算气候距离。

analogues

60.NOAA OWP的开源项目模板。

owp open source project tempalte

61.Jupyter Notebook上可交互的微件。

ipywidgets

62.超过290个的在QGIS里使用Google Earth Engine的例子。

qgis earthengine examples

63.轻松探索和解决您的WebGL场景。

Spector.js

64.面向游戏和工具的GLU镶嵌器重构版本。

libtess2

65.学习R的资源列表。

learning R

66.egg框架的postgres数据库连接插件。

egg postgres

67.R语言包diffeqr,用DifferentialEquations.jl求解R里面的微分方程。

diffeqr

68.Postgresql的笔记。

pg

69.面向PostGIS的轻量级RESTful地理空间要素服务器。

pg featureserv

70.R语言包showtext,在R图中更容易使用字体。

showtext

71.R语言包ggmaptile,从瓦片服务器添加地图影像的ggplot2拓展包。

ggmaptile

72.SCV是一个分布式GPU嗅探器。

SCV

73.发表在European Journal of Plant Pathology上的论文“The influence of increasing temperature and CO2 on Fusarium crown rot susceptibility of wheat genotypes at key growth stages”用到的代码。

FCR CO2 GH

74.Macos系统上命令行资源。

awesome macos command line

75.R语言包hexSticker,用R创建一个六角Logo。

hexSticker

76.是一套以人工智能为中心的对Jupyterlab notebook的扩展。

elyra

77.R语言包fs,基于libuv提供跨平台文件操作。

fs

78.simdjson:每秒解析千兆字节的json。

simdjson

79.数据分析的元概念,可重现的工作流程和项目。

analysis flow

80.基本流行病、活动和反馈COVID-19模型。

BEARmod

81.R语言包patientcounter,昨天上午10点有多少病人在医院里?在下午2点到下午6点之间的每15分钟中有多少人?在过去一周内,按小时数有多少?该软件包旨在使回答这些问题更加容易和快捷。

patientcounter

82.2019-nCov 新型冠状病毒 Python 数据分析。

nCov2019 analysis

83.COVID-19资源。

covid19 resources

84.作者PhD学位论文的Latex模板,ETH的博士,非官方模板。

thesis tex template

85.Sentinel/Landsat/CBERS/COGEO无服务器动态瓦片器。

remotepixel tiler

86.基于飞行时间原理的开放式硬件扫描激光测距仪。该激光雷达没有使用独立的激光测距仪模块,因此其原理图和固件完全开放。

OpenTOFLidar

87.ws3(木材供应模拟系统)是一个Python包,用于模拟景观水平的木材供应规划问题。

ws3

88.这是我在吴恩达的特别课程“深度学习专业化”上的作业。

Deep Learning

89.学习在2D图像空间中分割三维点云。

Learning to Segment 3D Point Clouds in 2D Image Space

90.HTML5 Canvas 2D Rendering Engine-小程序、小游戏以及 Web 通用 Canvas 渲染引擎。

cax

91.40行代码实现的高性能动画定时器。

raf interval

92.一个类似MNIST的时尚产品基准数据库。

fashion mnist

93.R语言包rpivotTable,表格透视图的R包实现。

rpivotTable

94.R语言包ggcharts,缩短从数据可视化理念到实际绘图的差距。

ggcharts

95.R语言包wateRinfo,从waterinfo.be下载时间序列数据。

wateRinfo

96.一个免费的,开源的三维重建软件,基于虚拟摄影测量计算机视觉框架。

meshroom

97.面向可移植性的C++异构计算接口。

HIP

98.社会物种的综合种群建模:以象海豹为例的研究。

socialseals

99.Python可组合命令行界面工具包。

click

100.R语言包embed,分类变量预测嵌入的额外方法。

embed

101.R语言包GSODR,Global Surface Summary of the Day(GSOD)天气数据客户端。美国国家环境信息中心(NCEI)提供的GSOD数据是覆盖全球的天气数据的重要来源。

GSODR

102.leetcode问题的答案。

leetcode

103.COVID-19开放数据集。

data

104.COVID-19的仪表盘,交互式的Jupyter notebook。

covid dashboard

105.R语言包fillmap,使用空间多边形的R对象创建地图。

fillmap

106.Jullia语言官网。

www.julialang.org

107.Google的AI研究集合。

google research

108.我们的模型称为GPT-2(是GPT的继承者),仅经过训练即可预测40GB的互联网文本中的下一个单词。

venti pytorch

109.基于lxml/请求的现代/快速python SOAP客户端。

python zeep

110.一个简单和快速(响应< 200毫秒)的API,用于跟踪全球冠状病毒(COVID-19,非典-CoV-2)的爆发。它是基于Flask框架用python编写的。

coronavirus tracker api

111.跨尺度预测模型(MPAS)是一个合作项目,旨在开发用于气候、区域气候和天气研究的大气、海洋和其他地球系统模拟组件。

MPAS Model

112.voilà将jupiter notebook转变为独立的网络应用。

voila

113.用最小的JupyterHub部署Voilà画廊的配置。

tljh voila gallery

114.运行binder的命令行界面。

binderbot

2 Paper:

1.Substantial undocumented infection facilitates the rapid dissemination of novel coronavirus (SARS-CoV2)/大量无证感染可促进新型冠状病毒(SARS-CoV2)的快速传播

估计未记录的新型冠状病毒(SARS-CoV2)感染的发生率和传染性对于了解该疾病的总体发生率和大流行潜力至关重要。在这里,我们结合流动性数据,网络化的动态人口模型和贝叶斯推断,结合在中国境内已报告的感染情况,推断出与SARS-CoV2相关的关键流行病学特征,包括未证明的感染率及其传染性。我们估计,在2020年1月23日旅行限制之前,所有感染中有86%是无证的(95%CI:[82%–90%])。人均未记录感染的传播率是已记录感染的55%([46%–62%]),但由于数量较多,未记录感染是79%已记录病例的感染源。这些发现解释了SARS-CoV2在地理上的迅速传播,并表明对该病毒的遏制将特别具有挑战性。Science上最新的SARS-CoV2病毒传播的分析,估算了无症状感染比例,这是一个非常有用而且有效的研究,对传染病建模与病毒传播模拟具有非常重要的意义。

2.The GGCMI phase II emulators: global gridded crop model responses to changes in CO2, temperature, water, and nitrogen (version 1.0)/GGCMI II期模拟器:全局网格化作物模型对CO2,温度,水和氮变化的响应(1.0版)

统计模拟允许将统计和基于过程的作物模型的优势结合在一起,以了解未来气候变化对作物产量的影响。我们在这里描述使用全球网格化模型比对项目(GGCMI)第二阶段的输出为九种基于过程的作物模型和五种作物的模拟器的开发。 GGCMI II期实验的设计目标明确是为模拟器开发生成结构化的训练数据集,该数据集涉及与作物产量有关的四个维度的样本:大气中的二氧化碳(CO2)浓度,温度,供水和氮输入(CTWN)。模拟是在两种不同的适应性假设下进行的:在温暖的气候下生长季节会缩短,而品种的选择可使生长季节保持固定。该数据集可以模拟气候平均产量响应,而无需依赖年际变化。我们证明这些在数量上是不同的。几乎在所有位置都可以通过简单的多项式轻松捕获气候平均单产响应,仅在某些目前未种植农作物的边缘土地上,误差才很明显。通常,相对于作物模型甚至气候模型方案之间的差异,仿真错误可以忽略不计。我们证明,即使GGCMI II期数据集是用统一的CTWN偏移量构建的,所得的GGCMI模拟器仍可以在现实的未来气候模拟下重现产量,这表明相对于变化的手段而言,温度和降水分布变化的影响很小。因此,最终的模拟器以轻巧,易于计算的形式捕获相关的作物模型响应,从而提供了一种工具,可以促进模型比较,诊断影响产量的相互作用因素以及对气候影响进行综合评估。GDD上的一篇预出版文章,集成多种基于过程的作物生长模型与数据的网格化模型。对于作物模型与产量估算是当前作物估算的先进研究。

3.WUDAPT: An Urban Weather, Climate, and Environmental Modeling Infrastructure for the Anthropocene/WUDAPT:人类世的城市天气,气候和环境建模基础设施

世界城市数据库和访问门户工具(WUDAPT)是一项基于国际社区的计划,旨在获取和传播城市自然地理上与气候相关的数据,以进行建模和分析。当前关于城市的全球一致信息的空白是阻碍城市气候科学向城市规模的信息减缓和适应战略提供信息和发展的主要障碍。 WUDAPT由数据库和门户系统组成;它的数据库被组织成代表不同详细程度的层次结构,并使用创新协议获取数据,这些协议利用众包方法,Geowiki工具,可自由访问的数据和构建类型原型。基本信息(L0)包括城市的局部气候区(LCZ)地图;每个LCZ类别都与与模型相关的表面描述符的值范围(粗糙度,不透水的表面覆盖物,屋顶面积,建筑物高度等)相关联。级别1(L1)和级别2(L2)将以更高的精度为其他相关描述符提供特定的城市内部值,例如数据形态,材料成分数据和能源使用量。本文介绍了WUDAPT项目的状态,并使用观察和模型演示了其潜在价值。作为一个基于社区的项目,鼓励其他研究人员参与以帮助创建一个对城市气候科学家有价值的全球城市数据库。基于VGI众包数据的一套城市数据库,基于社区的项目,为更精细化的气候适应变化城市规划提供基础数据。

4.A spatio-temporal method for crime prediction using historical crime data and transitional zones identified from nightlight imagery/使用历史犯罪数据和从夜光图像中识别出的过渡区域进行犯罪时空预测的方法

准确的犯罪预测可以帮助分配警察资源以减少和预防犯罪。有两种流行的方法来预测犯罪活动:一种是基于历史犯罪,另一种是基于与犯罪模式相关的环境变量。以前关于地统计建模的研究主要考虑时空域中的一种类型的数据,很少尝试混合多源数据。在这项研究中,我们提出了一种时空Cokriging算法,将历史犯罪数据和城市过渡区进行整合,以实现更准确的犯罪预测。时间序列历史犯罪数据被用作主要变量,而从VIIRS夜光图像中识别出的城市过渡区被用作次要协变量。该算法已应用于预测俄亥俄州辛辛那提市每周的街头犯罪和热点事件。与不使用协变量的对照组相比,使用统计检验和预测准确性指数(PAI)和预测效率指数(PEI)检验来验证预测。验证结果表明,该算法结合历史犯罪数据和城市过渡带,在统计测试中将工作日的相关系数提高了5.4%,将周末的相关系数提高了12.3%,并且在热点测试中通过PAI/PEI测得的命中率更高。柳林老师团队的成果,结合夜间灯光数据以及历史犯罪数据识别过渡区域用以犯罪时空预测,非常有意思的研究,而且是采用了时空协同克里金算法。算是利用更多用于自然地理学的地统计算法进行人文地理方面的研究,是一个很不错的研究。

5.WRF-GC: online coupling of WRF and GEOS-Chem for regional atmospheric chemistry modeling, Part 1: description of the one-way model (v1.0)/WRF-GC:WRF和GEOS-Chem的在线耦合用于区域大气化学建模,第1部分:单向模型说明(v1.0)

我们开发了WRF-GC模型,该模型是天气研究和预报(WRF)中尺度气象模型与GEOS-Chem大气化学模型的在线耦合,用于区域大气化学和空气质量建模。 WRF和GEOS-Chem都是开源的,并得到社区的支持。 WRF-GC使区域化学建模人员可以轻松访问GEOS-Chem化学模块,该模块配置稳定,技术先进,有据可查,可追溯,基准化,由大型国际用户群积极开发并集中管理由专门的支持团队进行管理。同时,WRF-GC使GEOS-Chem用户能够对感兴趣的任何位置和时间进行高分辨率预测和后播。 WRF-GC的设计易于使用,大规模并行,可扩展且易于更新。 WRF-GC耦合结构允许两个父模型之一的将来版本立即集成到WRF-GC中。这使WRF-GC可以保持最新状态,并且可以追溯到父模型版本。 WRF和GEOS-Chem中的物理和化学状态变量在分布式内存中进行管理,并在运行时由WRF-GC耦合器在两个模型之间转换。我们使用WRF-GC模型模拟了2015年1月22日至27日中国各地的PM2.5浓度,并将结果与地面观测结果以及GEOS-Chem嵌套网格模拟的结果进行了比较。两种模型都能够再现观测到的区域PM2.5的时空变化,但是WRF-GC模型(r = 0.68,偏差= 29%)比GEOS-Chem模型更好地再现了中国东部地区观测到的每日PM2.5浓度。做到了(r = 0.72,偏差= 55.%)。这主要是因为我们的WRF-GC模拟在地面和高层气象观测的推动下能够更好地表示模拟期间中国大陆行星边界层高度的时空变化。父模型和WRF-GC耦合器都在计算核心之间并行化,并且可以扩展到大规模并行体系结构。在相同的分辨率和相同数量的计算核的情况下,WRF-GC仿真的效率是GEOS-Chem嵌套网格仿真的三倍,这是由于WRF软件框架提供了更高效的传输算法和基于MPI的并行化。 WRF-GC在各种计算平台上几乎可以完美扩展到几百个内核。 WRF-GC模型的1.0版仅支持单向耦合,它使用WRF模拟的气象驱动场来驱动GEOS-Chem,而没有来自GEOS-Chem的反馈。双向耦合能力的发展,即模拟化学到气象学的辐射和微物理反馈的能力。 WRF-GC模型是开源的,可从http://wrf.geos-chem.org 免费获得。耦合WRF和GEOS-Chem模型模拟PM2.5模型,但目前是单向耦合——即以WRF的气象数据来驱动GEOS-Chem。算是数值模拟领域在PM2.5的最新进展,后面有空来研究。

6.Impact of physiological and phenological change on carbon uptake on the Tibetan Plateau revealed through GPP estimation based on spaceborne solar-induced fluorescence/基于星载太阳诱导荧光的GPP估计揭示了生理和物候变化对青藏高原碳吸收的影响

尽管初级生产总值(GPP)是反映陆地生态系统功能的重要指标,但由于缺乏地面观测,因此GPP在青藏高原(TP)区域范围内的估算受到了限制。此外,尚不清楚气候引起的物候和生理变化如何进一步影响该地区的碳吸收。在这项研究中,我们首先基于改进的方法和GOME-2太阳诱导的荧光(SIF)反演,从2007年到2015年以8天的时间间隔和0.5°的分辨率估计了TP的GPP。所获得的基于SIF的GPP与通量观测和两种最新的GPP产品非常吻合,区域碳吸收为0.62%±0.04%PgC year-1或307%±22 gC m-2−year-1。使用基于SIF的GPP,确定了两个物候指标(生长季节的开始和结束日期,即SGS和EGS)和一个生理指标(最大光合作用能力,GPPmax),并且它们对年均GPP变异性的相对贡献为使用多元回归模型进一步定量分离。先进的SGS,延迟的EGS和增加的GPPmax都可以提高碳吸收,并且这三个指标的组合可以解释GPP年际变化的72%±20%。年度GPP对物候和生理变化的响应具有高度的海拔依赖性,因为大部分地区年度GPP的下降主要由GPPmax下降决定,而高海拔地区年度GPP的上升主要由高级SGS。这三个指标对温度和降水变化的响应都具有很大的空间异质性。我们的研究表明,SIF遥感可以为缺乏地面观测的地区提供估计GPP的独特机会,并且我们对气候诱发的物候和生理变化对高山生态系统GPP变异性的影响的加深了解可以改善GPP气候变化中的估计。基于叶绿素荧光遥感的GPP估算分析,叶绿素荧光遥感是近些年碳循环与遥感领域的热点研究方向,这是一篇不错的案例研究。

7.Deep learning-based remote and social sensing data fusion for urban region function recognition/基于深度学习的遥感与社会感知数据融合用于城市功能区识别

市区功能识别是合理的城市规划和管理的关键。由于功能性土地利用的复杂社会经济性质,仅使用遥感图像很难识别高密度城市中的城市区域功能。包含社会感知有可能改善功能分类性能。但是,有效地集成多源和多模式远程和社会感知数据在技术上仍然具有挑战性。在本文中,我们提出了一种新颖的基于端到端深度学习的远程和社会感知数据融合模型来解决此问题。已经开发了两种基于神经网络的方法,一种基于一维卷积神经网络(CNN),另一种基于长短期记忆(LSTM)网络,可自动提取具有时间差异的区分性社会感知特征,这些图像与通过残差神经网络提取的遥感图像特征融合在一起。利用社交和遥感数据的主要困难之一是两个数据源是异步的。我们已经开发出一种基于深度学习的策略,通过强制执行跨模态特征一致性(CMFC)和跨模态三重态(CMT)约束来解决这一缺失的模态问题。通过同时优化三个成本,包括分类成本,CMFC成本和CMT成本,我们以端到端的方式训练模型。已经对公开可用的数据集进行了广泛的实验,以证明所提出的方法在融合遥感和社会感知数据以进行城市功能区识别方面的有效性。结果表明,看似无关的物理遥感图像数据和社交活动感知签到数据确实可以互补,有助于提高城市功能识别的准确性。深圳大学李清泉老师团队的成果,基于遥感与社会感知数据融合识别城市功能区,耦合现在流行的地理大数据与对地观测数据,大数据目前在地理学的应用越来越深入。

8.High Temperature and High Humidity Reduce the Transmission of COVID-19/高温高湿降低了COVID-19的传播

本文研究了空气温度和湿度如何影响COVID-19的传播。在从105对病毒携带者和被感染者中估算出COVID-19的序列间隔后,我们计算了40例以上的中国100个城市中每个城市的每日有效生殖数R。使用2020年1月21日至23日的每日R值作为非干预传播强度的代理,我们发现,在针对100个中国城市的线性回归框架下,高温和高相对湿度分别显着降低了COVID-19的传播,即使控制了城市的人口密度和人均GDP。温度每升高1摄氏度,相对湿度每升高1%,R分别降低0.0383和0.0224。该结果与高温高湿显着减少流感的传播这一事实是一致的。这表明北半球夏季和雨季的到来可以有效减少COVID-19的传播。来自北航王静远老师团队关于COVID-19的研究,分析气象因子(高温高湿度)对COVID-19传播的影响。结论是否可靠还有待考察。

9.Incorporating climate effects in Larix gmelinii improves stem taper models in the Greater Khingan Mountains of Inner Mongolia, northeast China/在华北落叶松中纳入气候效应改善了内蒙古大兴安岭的茎锥模型

估计森林中的木材数量和碳储量对于造林和准确估算国家和全球碳预算至关重要。锥度模型是重要的工具,可用于预测沿树的任意高度的直径。年平均温度(MAT)和年平均降水量(MAP)影响树木的生长,但它们对茎形的精确影响仍知之甚少,而且锥度模型中很少包括气候因素。为了评估气候对树茎的影响,我们将MAT和MAP作为协变量纳入Kozak(2004)模型中,以提高拟合优度的模型性能。使用非线性混合效应(NLME)建模技术对结合了MAT和MAP的Kozak(2004)模型进行了重新拟合,以说明样本树内异方差性和自相关结构在残差中的自相关性,这些残差来自沿着同一单个树茎的不同点处测得的数据Larix gmelinii(Rupr。)结果表明,通过将MAT和MAP用作协变量,提高了Kozak(2004)模型的预测准确性。结合了MAT和MAP的Kozak(2004)模型对茎直径的预测精度最高,紧随其后的是仅结合MAT的模型,然后是仅结合MAP的模型。 MAT对树茎形状的影响要强于MAP。 NLME Kozak(2004)模型结合了具有指数方差函数的MAT和MAP和一阶连续自回归相关结构(CAR(1)模型),消除了残差中的异方差和自相关,具有最佳的预测性能。因此,建议使用这种改进的模型来计划和管理天然落叶松林。总之,将气候变量的影响纳入茎锥度方程式可以显着改善木材体积和生物量估计,特别是在恶劣的环境下,例如天然北方森林。利用气象数据来提升森林的几何结构变化模型,从而间接提升森林的生物量。

10.Disaggregating a Regional Extent Digital Soil Map using Bayesian Area-to-Point Regression Kriging for Farm-Scale Soil Carbon Assessment/使用贝叶斯面积到点回归Kriging分解区域范围的数字土壤图,用于农场规模的土壤碳评估

大多数土壤管理活动都是在农场规模上实施的,但是数字土壤图通常可以在区域/国家范围内获得。分解这些区域/国家地图以适用于农场规模的任务,尤其是在数据贫乏或有限的情况下。尽管分解是最近DSM文献中经常讨论的话题,但是分解过程的不确定性却不经常讨论。统计模型中对推断性或预测性不确定性的低估会导致统计摘要不准确和决策过于自信。贝叶斯推断的使用允许量化与分解过程相关的不确定性。在这项研究中,提出了一种用于降低土壤属性(尤其是土壤有机碳图)的贝叶斯面积到点回归克里金(ATPRK)框架。使用Metropolis-Hasting算法,使用蒙特卡洛积分,从数据块支持的数据中估算点支持变异函数。将澳大利亚新南威尔士州北部一个农场的分辨率为100µm(块支撑)的区域土壤碳图分解为10µm(点支撑)信息。派生的点支持变异函数图具有较高的局部门槛和块金,而范围和参数与块支持数据的偏差不大。使用贝叶斯ATPRK分解的细比例尺图(点支持,网格间距为10 supportm)与原始粗比例尺图具有87%的一致性。分解过程的不确定性估计值由95%置信区间(CI)限制给出。狭窄的CI极限表明,分解过程给出了研究地点平均SOC含量的近似值。贝叶斯ATPRK方法与dissever进行了比较。基于回归的分解算法。 Dissever生成的分解图与粗比例图的一致性为96 conc%。 Dissever通过迭代过程实现了更高的一致性相关性,而贝叶斯ATPRK是一个一步的过程。通过127个独立的表土碳观测值对这两个分类的产品进行了验证。贝叶斯ATPRK分解的验证一致性相关系数为23%,而因异议而生成的缩小地图的CCC为18%。讨论了两种分解算法的优缺点。基于贝叶斯面积到点回归克里金框架实行数字土壤制图研究,并且与desserver数据作对比。

11.Incorporating spatial association into statistical classifiers: local pattern-based prior tuning/将空间关联纳入统计分类器:基于局部模式的事先调整

通过根据局部空间格局调整先验分类概率,提出了一种新的空间数据分类方法。首先,提出的方法使用经典的统计分类器对训练数据进行建模。其次,根据局部空间模式估计先验分类概率,并使用估计的先验概率对每个看不见的对象进行分类。最后,每个看不见的对象都使用其适应的分类器进行分类。由于该新方法可以与生成统计量判别器和判别统计量分类器结合使用,因此对于各种不同的空间数据集,该方法通常比其他方法更准确。实验结果表明,与不考虑空间信息的统计分类器相比,该方法的预测误差更低。此外,在实验中,当使用适当的局部先验类分布估计时,新方法也优于基于空间自动逻辑回归和基于马尔可夫随机场的方法。将空间关联与机器学习分类方法做融合,结果较为突出。

12.A Bayesian Three-Cornered Hat (BTCH) Method: Improving the Terrestrial Evapotranspiration Estimation/贝叶斯三角帽(BTCH)方法:改进陆地蒸散量估算

在这项研究中,开发了一种基于贝叶斯的三角帽子(BTCH)方法,以通过集成多源ET产品而不使用任何先验知识来改进对陆地蒸散量(ET)的估计。通过BTCH和整体平均(EM)方法,对来自连续美国(CONUS)上的统计或经验,遥感和陆地表面模型的10个长期(30年)网格化ET数据集进行了整合。来自AmeriFlux站点的涡度协方差塔(ETEC)的ET观测值和水平衡法(ETWB)的ET值用于评估BTCH和EM集成的ET估计值。结果表明,BTCH的性能优于EM和所有单个母产品。此外,采用Mann-Kendall方法分析了1982年至2011年BTCH积分ET估计的趋势及其影响因素(例如,气温,归一化植被指数和降水)。最后,根据BTCH综合的ET估算值,反演了密西西比河流域(MRB)的30年(1982年至2011年)总储水量异常(TWSA)。这项研究中的TWSA资料与重力恢复和气候实验(GRACE)的资料非常吻合。基于贝叶斯算法估算ET,融合了卫星对地观测以及模型数据。

13.GeoVisuals: a visual analytics approach to leverage the potential of spatial videos and associated geonarratives/GeoVisuals:一种视觉分析方法,可利用空间视频和相关地理叙事的潜力

嵌入了空间坐标的视频,尤其是与其他专家见解结合使用时,可以为多种不同环境获取精细的多时间段上下文化数据。但是,尽管这些地理空间多媒体(GSMM)数据包含大量的时空,语义和视觉信息,但迄今为止,仍缺乏使用一套视觉和交互式分析技术和工具来充分利用其潜力的方法。在本文中,我们通过首先确定GSMM数据所需的任务类型,然后提出一个解决方案平台来解决这一差距。该GeoVisuals系统利用基于可空间集成的语义数据点的可视化分析方法,从而使时空查询和文本查询相结合,可以在统一数据库中进行管理。一套可视化功能集成在两种调查模式中:地理视频分析和地理位置分析。叶信岳老师团队的成果,发表在IJGIS上,提供了一套系统用于分析地理视频。这一块之前本科学院的老师也做过,核心思路还是对视频做语义分割。

14.Advancing Agricultural Production With Machine Learning Analytics: Yield Determinants for California’s Almond Orchards/通过机器学习分析促进农业生产:加利福尼亚杏仁园的产量决定因素

农业生产力面临各种压力,包括非生物和生物威胁,气候变化会加剧许多威胁,从而影响长期可持续性。树木(例如杏仁园)的生产力特别复杂。要了解和缓解这些威胁,需要收集多层大数据集,而高级分析对于集成这些高度异构的数据集以生成有关树和田间规模产量关键约束的见解也至关重要。在这里,我们使用了一种机器学习方法,基于一个独特的10年光拦截和杏仁产量实地测量数据集以及气象数据,研究了加利福尼亚杏仁果园杏仁产量变化的决定因素。我们发现总体上最大的杏仁产量高度依赖于光的拦截,例如,光拦截的每增加1%,潜在产量就增加57.9磅/英亩。当春季的长期平均春季太阳辐射(SRAD)较高时,成熟地点的采光率最高,3月最高温度低于19°C时,幼果园的采光率最低。但是,在任何给定的光线拦截水平下,实际产量通常都大大低于全产量潜力,这主要受树木年龄,6月和冬季的温度曲线,夏季的平均每日最大蒸气压亏缺(VPDmax)和SRAD的驱动。使用六倍交叉验证,RMSE为480±9磅/英亩,利用完全随机森林模型可以解释82%(±1%)的产量变化。当从预测变量中排除光线的拦截时,果园的总体特征(例如年龄,位置和树木密度)和包容性的气象变量仍可以解释78%的产量变化。模型分析还显示,冬季温暖的条件经常限制成熟果园达到最大产量潜力,而夏季VPDmax超过40 hPa则明显限制了产量。通过机器学习方法,我们的发现提高了我们对气候,冠层光拦截和杏仁坚果产量之间复杂相互作用的理解,并证明了杏仁产量的相对可预测性。这最终将使数据驱动的气候适应和果园养分管理方法受益。利用机器学习推断果园产量因子,可以分析出接近80%的变量预测。