Dados do Trabalho
Título
MAPBIOMAS SOLO: AVALIAÇAO DO MODELO ESPAÇO-TEMPORAL EM UM CENARIO DE DADOS ESPACIALMENTE AGRUPADOS
Resumo
A validação cruzada (CV) comum de mapas digitais de solo pode gerar estimativas de incerteza (das predições) muito otimistas nos cenários em que as amostras de solo apresentam agrupamentos espaciais, comum em bases de dados legados. Nesse sentido a CV espacial é uma alternativa para inferir sobre a magnitude de erro dos MDS nas regiões com amostras esparsas, ajudando a refletir sobre as extrapolações dos modelos no espaço. Neste trabalho, avaliamos a qualidade das predições do mapeamento dos estoques de carbono orgânico do solo brasileiro (MapBiomas Solo, coleção beta) considerando as ambas abordagens. O modelo random forest foi treinado com 43 variáveis ambientais e 9650 amostras de campo obtidas do repositório SoilData. Os dados de campo apresentam distribuição heterogênea no espaço e tempo, com forte agrupamento em diferentes regiões do Brasil e ao longo do tempo (1985-2021). Na CV comum, do tipo k-Fold, as amostras foram divididas aleatoriamente em 10 subconjuntos e aleatoriamente sorteadas para uso no treinamento e validação do modelo. Na CV espacial, os dados passaram primeiro por um processo de agrupamento espacial e temporal usando k-Means (30 grupos). Os grupos de amostras foram aleatoriamente sorteados, também em 10 subconjuntos, para treinar ou validar o modelo. Na CV, o modelo apresentou o RMSE (raiz quadrada do erro quadrático médio) de 3,67 kg m-2 e NSE (eficiência do modelo) de 0,37. Em contraponto, na validação cruzada espacial foi de 4,18 kg m-2 e NSE de 0,08. As métricas da CV são a melhor estimativa de qualidade dos mapas nas áreas com maior número de amostras. Por outro lado, em locais com menor densidade amostral, as métricas de CV espacial podem assumir esse papel. Por isso, ao avaliar métricas de CV, é fundamental considerar a densidade amostral. Sugerimos que a melhor estimativa global do modelo espaço-temporal da coleção beta do MapBiomas Solo é a média aritmética de ambas validações, ou seja, RMSE = 3,9 kg m-2 e NSE = 0,22.
Palavras-chave
Pedometria; Modelagem espaço-temporal; MapBiomas Solo; Aprendizado de máquina; SoilData.
Instituição financiadora
CNPq, Fundação Araucária e Instituto Arapyaú.
Agradecimentos
UTFPR, MapBiomas, FUNAPE e FUNTEF.
Área
Divisão 1 – Solo no espaço e no tempo: Comissão 1.3 - Pedometria
Autores
TACIARA ZBOROWSKI HORST, MARCOS VINÍCIUS S CARDOSO, ANA CAROLINE PRETTO, ERLI PINTO DOS SANTOS, BÁRBARA DA COSTA SILVA, WALLACE VIEIRA SILVA, ALESSANDRO SAMUEL ROSA