Vis enkel innførsel

dc.contributor.authorKastdalen, Leif
dc.contributor.authorHjeltnes, Arne
dc.date.accessioned2012-12-20T12:35:08Z
dc.date.accessioned2017-04-19T13:28:20Z
dc.date.available2012-12-20T12:35:08Z
dc.date.available2017-04-19T13:28:20Z
dc.date.issued2013-01-18
dc.identifier.citationKastdalen, L. & Hjeltnes, A. Nordmann, O. Vegetasjonskartlegging med satellittdata. Optimalisering av analysemetodikk. HiT-skrift 7/2012. Høgskolen i Telemark, 2012
dc.identifier.isbn978-82-7206-357-2
dc.identifier.issn1503-3767
dc.identifier.urihttp://hdl.handle.net/11250/2439215
dc.description.abstractENGLISH SUMMARY: This study highlights the benefits of carrying out an optimization of the analytical process in land cover mapping from satellite data. The report describes the optimization of the different steps in a mapping project, establishment of ground truth, data used to expand the mapping area to a large area map and the method used in this process. The starting point was a SPOT5-scene and an accurately collected set of spatial data for different land classes collected from different parts of the mapping area, thus giving the opportunity to use statistical models for the classification. Through the optimization process we improved the accuracy for 29 vegetation classes by 17%. By using simple rules for acceptance of a class, consisting of a combination of accuracy and ecological importance, the final map was reduced to 19 classes with 73% overall accuracy. In addition, we made a reduced thematic map with 10 major classes divided such that a finer division will be possible with the use of a vigorous information index like NDVI. This map with 10 major classes achieved an overall accuracy of 78%. For the division of thematic classes, the emphasis is a set of main classes based on dominant vegetation, and further sub-division using the vigorousness of the vegetation. The vigorous¬ness scale we used is strongly related to species composition, and is therefore closer to a plant sociological poor-rich gradient than what a spectral vegetation index like NDVI will be. The training data is linked to small areas of homogeneous vegetation drawn on a map with automatic segmentation procedure. The identification of vegetation classes is done with a combination of field visits and image interpretation. A total of 22 995 data divided into 34 classes are collected for the ground truth. In addition to data from the SPOT5 satellite, the classification was based on data derived from the national terrain model (DTEM) and from other maps. From satellite data we derived a number of variables, such as vegetation indices, texture, standard deviation, principal component and colour space conversion. From the terrain model we derived information about the slope, exposure and indexes of lighting conditions, ruggedness and topographic position, and in combination with field data information about the height of the tree line. We have also collected information from N50 and AR5 maps, as well as from a map of bioclimatic zones. Summing up, this amounted to 102 possible explanatory variables. With the use of an importance index delivered from analysis with Random forest algorithm we reduced the number of explanatory variables to 19 without significantly affecting the classification accuracy (only 1% lower than when using all variables). In the analysis, we examined the effect of the number of training data, the impact of the imbalance between the different classes in the training data set and the effect of making illumination correction of satellite data as a pre-processing step. Moreover, comparison is made between the approach of supervised and unsupervised classification and a number of different algorithms are tested for accuracy. The most accurate results were obtained with an ? algorithm that combines the results from several different algorithms, in our case, Random forest and Support Vector Machine. In this meta-analysis, the probability values of belonging to each class, which comes from Random forest and Support Vector Machine analyses, are further analysed with a multi-response linear regression. We compared our training data with the maps SatVeg and AR5, and found an overall compliance of only 38% with the SatVeg map and 67% with selected AR5 classes. Since the AR5-map comparison consists of fewer classes, a better compliance is expected. Classes in the AR5-map that change rapidly, ie. coniferous forest, mixed forest and deciduous forest was classified to an accuracy of 80%, a level that is difficult to achieve even with traditional field based mapping methods. The results show that satellite data such as SPOT5 can be used to update themes in the AR5-maps.
dc.description.abstractNORSK SAMMENDRAG: Denne undersøkelsen belyser hvilke gevinster som kan oppnås ved å optimalisere de prosesser som inngår i produksjon av arealdekkekart fra satellittdata. Rapporten beskriver effekten av optimalisering for hvert av leddene i et kartleggingsprosjekt; data om bakketilstanden, dataene som benyttes for å utvide kartleggingsarealet til et heldekkende kart og analyse¬metoden som inngår i denne prosessen. Utgangspunktet var et opptak fra SPOT5-satellitten og et nøyaktig innsamlet sett med stedfestede data for ulike arealklasser innhentet fra ulike deler av kartleggings¬området. Tilgangen på gode treningsdata gir muligheten til å benytte styrt klassifikasjon med bruk av statistiske modeller. Gjennom optimaliseringsprosessen forbedret vi samlet nøyaktighet for 29 vegetasjonsklasser med 17%. Ved bruk av enkle regler for å akseptere en klasse, bestående av en kombinasjon av nøyaktighet og økologisk betydning, ble det endelige kartet redusert til 19 klasser med samlet nøyaktighet på 73% evaluert mot uavhengige data. I tillegg ble det laget et kart basert på en tematisk inndeling i 10 hovedklasser som var inndelt slik at en finere inndeling var mulig basert på frodighetsinformasjonen fra en vegetasjonsindeks som NDVI. Denne hovde¬klasse¬inndelingen oppnådde en samlet nøyaktighet på 78%. I den tematiske inndeling er hovedklassene valgt ut fra hva som er dominerende vegetasjon, og deretter inndelinger mer etter frodighet. Frodighetsskalaen vi benyttet er sterkt knyttet til artssammensetningen, og står derfor nærmere en plante-sosiologisk fattig-rik gradient enn hva en spektral vegetasjonsindeks som NDVI vil gjøre. Treningsdata er knytt til små areal med homogen vegetasjon opptegnet ved bruk av automatisk segmenteringsprosedyre. Identifisering av vegetasjonsklasse er gjort med en kombinasjon av feltbesøk og bildetolkning. Totalt ble det innsamlet 22 995 observasjoner av bakketilstanden fordelt på 34 klasser. I tillegg til data fra SPOT5 satellitten, ble det i klassifikasjonen benyttet data fra den nasjonale terrengmodellen og fra andre kartdata. Fra satellittdataene ble det avledet en rekke variabler, som vegetasjonsindekser, tekstur, standard avvik, prinsipalkomponenter og konvertering av fargerom til HSI. Fra terrengmodellen ble det direkte avledet informasjon om stigning, eksposisjon, solinnstråling, ruhet og topografisk posisjon, og indirekte i kombinasjon med feltdata informasjon om høyden fra tregrensa. Av andre kartdata hentet vi informasjon fra N50 og AR5 kartene, samt fra et kart over bioklimatiske soner. Som utgangspunkt for modelleringen utgjorde dette 102 mulige forklaringsvariabler. Ved bruk av en indeks for variablenes betydning i en modell med algoritmen Random forest reduserte vi antallet variabler til 19 uten at det påvirket nøyaktigheten i klassifikasjonen nevneverdig (kun 1% lavere enn ved bruk av alle variablene). I analysene undersøkte vi effekten av antallet treningsdata, virkningen av ubalanse mellom de ulike klassene i treningsdatasettet og virkningen av å foreta belysningskorreksjon på satellittdata før videre behandling. Videre er det gjort sammenlikninger mellom en styrt og ikke-styrt klassifikasjonstilnærming, og testet nøyaktigheten av en rekke ulike algoritmer. Det meste nøyaktige resultat ble oppnådd med en algoritme som kombinerer resultat fra flere ulike algoritmer, i vårt tilfelle Random forest og Support Vektor Maskin. Dette blir gjort ved å benytte sannsynlighetsverdier for tilhørigheten til hver enkelt klasse, hentet fra Random forest og Support Vektor Maskin analysene, i en multi-respons lineær regresjon. Vi har sammenliknet våre treningsdata med de nasjonalt heldekkende kartene SatVeg og AR5, og fant samlet overens¬stemmelse på bare 38% med SatVeg kartet og 67% med utvalgte AR5 klasser. Nå består AR5 kartet av en mindre nyansert tematisk inndeling, så bedre overensstemmelse her er å forvente. Klassene i AR5 som endres raskest, dvs. barskog, blandings¬skog og løvskog, ble klassifisert med en nøyaktighet på 80%, en nøyaktighet som det er vanskelig å oppnå selv med tradisjonell feltbasert kartleggingsmetodikk. Resultatet viser at satellittdata, slik som SPOT5, kan benyttes til oppdatering av disse tema i AR5-kartverket.
dc.language.isonob
dc.publisherHøgskolen i Telemark
dc.relation.ispartofseriesHiT skrift
dc.subjectland cover
dc.subjectsatellite data
dc.subjectSPOT5
dc.subjectsupervised classification
dc.subjectoptimization
dc.subjecttemakart
dc.subjectvegetasjonskartlegging
dc.subjectsatellittdata
dc.subjectSPOT5
dc.subjectstyrt-klassifikasjon
dc.subjectoptimalisering
dc.titleVegetasjonskartlegging med satellittdata. Optimalisering av analysemetodikk
dc.typeResearch report
dc.description.versionPublished version
dc.rights.holder© The Authors/Telemark University College
dc.subject.nsi555
dc.subject.nsi455


Tilhørende fil(er)

Thumbnail

Denne innførselen finnes i følgende samling(er)

Vis enkel innførsel