Des chercheurs ont développé un modèle d'intelligence artificielle avancé qui produit des cartes haute résolution de la hauteur des canopées en utilisant uniquement des images RGB standards, atteignant une précision proche du lidar pour la surveillance précise de la biomasse forestière et du stockage de carbone sur de vastes zones. Cette innovation répond au besoin critique d'une surveillance forestière économique, car les forêts et les plantations jouent un rôle vital dans la séquestration du carbone, alors que les méthodes traditionnelles restent coûteuses et laborieuses.
L'équipe de recherche conjointe de l'Université forestière de Pékin, de la Manchester Metropolitan University et de l'Université Tsinghua a publié ses résultats dans le Journal of Remote Sensing le 20 octobre 2025. Leur étude présente un nouveau cadre qui combine de grands modèles de vision de base avec l'apprentissage auto-supervisé pour fournir une précision inférieure au mètre dans l'estimation de la hauteur des arbres à partir d'images satellitaires RGB. La recherche aborde le problème de longue date de l'équilibre entre coût, précision et évolutivité dans la surveillance forestière, offrant un outil prometteur pour la gestion des plantations et le suivi de la séquestration du carbone dans le cadre d'initiatives telles que le programme chinois de Réduction Certifiée des Émissions.
La surveillance de la structure des canopées forestières est essentielle pour comprendre les cycles mondiaux du carbone, évaluer la croissance des arbres et gérer les ressources des plantations. Les systèmes lidar traditionnels fournissent des données de hauteur précises mais sont limités par des coûts élevés et une complexité technique, tandis que la télédétection optique manque souvent de la précision structurelle requise pour les plantations à petite échelle. Le nouveau modèle de vision piloté par l'IA comble cette lacune en atteignant une erreur absolue moyenne de seulement 0,09 mètre et un R² de 0,78 par rapport aux mesures lidar aéroportées, surpassant les méthodes traditionnelles basées sur les CNN et les transformateurs.
L'architecture du modèle se compose de trois modules : un extracteur de caractéristiques alimenté par le grand modèle de vision de base DINOv2, une unité d'amélioration des caractéristiques auto-supervisée pour conserver les détails spatiaux fins, et un estimateur de hauteur convolutionnel léger. Cette approche a permis une précision de plus de 90 % dans la détection d'arbres individuels et de fortes corrélations avec la biomasse aérienne mesurée. Le modèle a démontré une forte généralisation entre les types de forêts, le rendant adapté à la comptabilité du carbone à l'échelle régionale et nationale.
Les tests dans le district de Fangshan à Pékin, une zone avec des plantations fragmentées principalement composées de Populus tomentosa, Pinus tabulaeformis et Ginkgo biloba, ont montré que le modèle d'IA produisait des cartes de hauteur de canopée correspondant étroitement aux données de terrain. En utilisant des images Google Earth d'une résolution d'un mètre et des références dérivées du lidar, le modèle a surpassé de manière significative les produits mondiaux de modèles de hauteur de canopée, capturant des variations subtiles dans la structure des cimes que les modèles existants manquaient souvent. Les cartes générées ont permis la segmentation d'arbres individuels et l'estimation de la biomasse au niveau des plantations avec des valeurs R² dépassant 0,9 pour les espèces clés.
Lorsqu'il a été appliqué à une forêt géographiquement distincte à Saihanba, le réseau a maintenu une précision robuste, confirmant son adaptabilité interrégionale. La capacité à reconstruire les tendances de croissance annuelles à partir d'images satellitaires archivées fournit une solution évolutive pour la surveillance à long terme des puits de carbone et la gestion forestière de précision. La méthodologie de recherche a employé un cadre d'apprentissage profond de bout en bout combinant les caractéristiques de grands modèles de vision de base pré-entraînés avec un processus d'amélioration auto-supervisé, utilisant des images Google Earth haute résolution de 2013 à 2020 comme entrée et des données lidar basées sur des drones comme référence pour l'entraînement et la validation.
Le Dr Xin Zhang, auteur correspondant à la Manchester Metropolitan University, a déclaré que leur modèle démontre que les grands modèles de vision de base peuvent transformer fondamentalement la surveillance forestière. En combinant le pré-entraînement d'images global avec l'amélioration auto-supervisée locale, l'équipe a atteint une précision de niveau lidar en utilisant des images RGB ordinaires, réduisant considérablement les coûts et élargissant l'accès à des données forestières précises pour la comptabilité du carbone et la gestion environnementale.
Le cadre de cartographie basé sur l'IA offre une approche puissante et abordable pour suivre la croissance forestière, optimiser la gestion des plantations et vérifier les crédits carbone. Son adaptabilité entre les écosystèmes le rend adapté aux programmes mondiaux de surveillance de l'afforestation et de la reforestation. Comme détaillé dans l'étude publiée à https://spj.science.org/doi/10.34133/remotesensing.0880, cette innovation pourrait jouer un rôle central dans la réalisation d'une foresterie durable et de l'atténuation du changement climatique alors que le monde progresse vers des objectifs de neutralité carbone. Les recherches futures étendront cette méthode aux forêts naturelles et mixtes, intégreront une classification automatisée des espèces et soutiendront des plateformes de surveillance du carbone en temps réel.


