PDF2GIS: van tekeningen naar geo-data.

Inleiding

We denken al snel dat we aan het digitaliseren zijn, als we een A4tje scannen en omzetten in een PDF. In zekere zin is dit waar, maar zonder een idee of doel heb je aan een pdf evenveel (of even weinig) als aan een hardcopy. We komen uit een tijd, dat de PDF een betrouwbare en geaccepteerde versie werd van de papieren uitgave. Voor de formele substitutie van het papieren archief naar een digitaal archief moet een PDF wel aan een aantal voorwaarden voldoen, zoals het volledig leesbaar zijn van bijvoorbeeld grafieken, foto’s met onderschrift en tabellen. En dan heb je een digitaal archief ergens opgeborgen in de krochten van een E-schijf. Ook al wordt dit proces op een correcte manier uitgevoerd, dan nog steeds is het resultaat statisch en is een eventuele handmatige bewerking niet weggenomen. Er moet dus meer gebeuren! Zo’n proces is inmiddels gestart voor het bewerken van bouw- en splitsingstekeningen.

Aanleiding

Met de invoering van de Wet waardering onroerende zaken in 1995 hebben de gemeenten er een nieuwe taak bij gekregen. De uitvoering van de wet ligt bij het college van burgemeester en wethouders en de externe controle bij de onafhankelijke Waarderingskamer. De invordering en heffing van de onroerend zaakbelasting gebeurt op basis van taxaties, die zorgvuldig en compleet moeten zijn. De Waarderingskamer doet onderzoek naar de kwaliteit van deze taxaties. In het Beoordelingsprotocol Objectkenmerken worden de primaire objectkenmerken gedefinieerd en dat zijn (citaat) “de fysieke kenmerken van een WOZ-object en hebben een objectief/meetbaar karakter. In een aantal gevallen liggen deze vast in (of worden ontleend aan) een basisregistratie van binnen of van buiten de gemeente. Onder primaire objectkenmerken verstaan wij: de grootte (inhoud, oppervlakte, perceel grootte, etc.), het bouwjaar, het adres / de buurt), het type / soort object en de registratie van objectdelen (aanwezigheid van tuinhuis, garage, dakkapel, etc.)”.

De taxatie moet dus gebeuren op basis van informatie conform de objectkenmerken. Bij gemeenten voldoet het objectenbestand nog niet overal aan de door de Waarderingskamer gestelde voorwaarden. Dit lijkt een landelijk probleem en het bijwerken van de tekeningen naar het vereiste niveau is een arbeidsintensief en tijdrovende bezigheid.

Voor De afdeling Belastingzaken in Den Haag was dit voldoende aanleiding om in het “Startup in Residence”-programma een challenge uit te schrijven om te komen tot een applicatie, die helpt met het verwerken van splitsingstekeningen (met betrekking tot appartementsrechten bij WOZ-objecten). Coders Co. heeft de challenge gewonnen en samen met de afdeling Belastingzaken van de gemeente Den Haag PDF2GIS ontwikkeld en ontworpen. PDF2GIS kan worden ingezet door bijvoorbeeld gemeenten, woningbouwcorporaties of Consultancy en advies– en architectenbureaus om hun digitale archieven om te zetten in waardevolle informatie over de binnenkant van de gebouwen.

Wat is PDF2GIS

PDF2GIS is een applicatie, die die appartementstekeningen, bouwtekeningen en plattegronden omzet in geo-data. Daartoe combineert PDF2GIS de gegevens uit de tekeningen met basisregistraties, zoals WOZ, BAG en BGT. Alle gegevens uit de tekeningen worden gekoppeld aan bestaande objecten (panden, verblijfsobjecten, WOZ-objecten, etc.). PDF2GIS gebruikt daarbij kunstmatige intelligentie in combinatie met menselijk input om de tekeningen te verwerken. Het meeste werk wordt door de computer gedaan. De mens corrigeert en accordeert het werk van de computer. De correcties worden gebruikt om de zelflerende algoritmes steeds te verbeteren.

Als er meer dan 500 splitsingstekeningen zijn verwerkt, kan een aantal neurale netwerken in PDF2GIS (kunstmatige intelligentie) worden verbeterd. Dit leidt dan weer tot het versnellen van functionaliteiten. Daarbij moet je denken aan het verwerken van teksten, het herkennen van ruimtetypen en het herkennen van objectindexnummer van appartementsrechten.

Wat kan je met PDF2GIS?

De basis van PDF2GIS is het verwerken van bouwtekeningen, splitsingsaktes en plattegronden ten behoeve van de WOZ-taxatie en het opzetten van een samenhangende objecten registratie (SOR). De applicatie is ontwikkeld om plattegronden, splitsingsaktes en bouwtekeningen te transformeren naar vectoren (van analoog naar digitaal). Als bijkomende opties kunnen worden genoemd een 3D-visualisatie (simulatie), Interactie (inwoners en bedrijven) en het ontwikkelen van taxatie modellen. Voorts ontstaat er een gedegen basis voor monitoring en beheer en het aangeven van gebruiksfunctie per verdieping. Het betreft daarmee maatwerk, hetgeen op zich weer waardevol kan zijn bij het te zijner tijd inrichten van een omgevingsplan.

Waar is PDF2GIS voor?

PDF2GIS heeft in beginsel een twee doelen. Primair wordt PDF2GIS gebruikt voor het:

  • in kaart brengen van alle brutovloeroppervlaktes (BVO) van objecten;
  • in kaart brengen van alle gebruiksoppervlaktes (GO) van objecten;
  • accuraat berekenen van gebruiksoppervlaktes ten behoeve van OZB en
  • digitaliseren van plattegronden, splitsingsaktes en bouwtekeningen van PDF naar 3D.

Als secundaire doelen zien we het voorzien van digital twins gemeenten van content, een samenhangende objecten registratie (SOR) en tot slot het accuraat herkennen van objecten en vertalen naar vectoren.

Hoe werkt PDF2GIS?

De verwerking gebeurt in een aantal stappen (stadia). In elk stadium, wordt eerst een (machine-learning)algoritme uitgevoerd en de resultaat getoond aan de gebruiker. Vervolgens mag de gebruiker de resultaat corrigeren. Als de resultaat helemaal gecorrigeerd is, kan de gebruiker naar de volgende stadium gaan. De gecorrigeerde resultaten van een stadium worden gebruikt als input voor de volgende stadium.

Coders Co. heeft voor het zelfstandig werken met PDF2GIS een handleiding opgesteld, die in samenwerking met de gemeente Den Haag inmiddels is verbeterd. In de handleiding wordt de gebruiker van de applicatie wegwijs gemaakt in de mogelijkheden van PDF2GIS en door het proces geleid.

PDF2GIS kent de volgende stadia van verwerking:

1.Tekst

Het betreft hier een tekstdetectie, waarbij tekst zowel de letters en woorden als de cijfers omvat. Voor het in latere stadia gemakkelijker maken van de handelingen wordt de gedetecteerde tekst verwijderd.

2. Muren

In deze fase gaat het om het herkennen van lijnen, die later zullen worden gebruikt om ruimtes te vormen. Alle muren moeten correct zijn getekend en alle overtollige lijnen buiten het object kunnen worden genegeerd. In dit stadium van verwerking wordt voorts aandacht besteed aan het kopiëren van muren naar bijvoorbeeld een woonlaag met een gelijke indeling, wat verwerking van grote flatgebouwen versnelt.

3. Ruimtetypes

In dit stadium worden polygonen gevormd uit de eerder gedetecteerde lijnen. Ook worden de tekstvakken uit de ’Tekst’ stadium ingelezen door een OCR algoritme om ruimtelabels te herkennen. Deze labels worden dan ’geplakt’ op de polygonen om ruimtes te typeren. Er is een mogelijkheid om ruimtetypes te corrigeren.

Met het kopiëren van ruimtetypes maakt het mogelijk om tekeningen met soortgelijke bouwlagen veel sneller te verwerken.

4. Splitsing

Om appartementsrechten te vormen, wordt een algoritme uitgevoerd die dikke en dunne lijnen van elkaar scheidt, en op basis hiervan, ruimtes groepeert tot appartementsrechten met elk een eigen kleur. Ook bij deze functies zijn soortgelijke bouwlagen of appartementen sneller te verwerken.

5. Indexnummers

Het gaat hierbij om het toekennen van indexnummers aan appartementsrechten, waarbij de applicatie de indexnummers uit de tekening probeert te lezen. De gebruiker kan zo nodig corrigeren.

6. Etage/woonlaag

PDF2GIS probeert de etagenamen automatisch uit de tekening te lezen, welke handeling door de gebruiker kan worden gecorrigeerd.

7. Op kaart

In dit stadium wordt de tekening op de kaart gelegd, waarbij gebruik wordt gemaakt van de relaties uit het stelsel van basisregistraties zoals die besloten liggen in de WOZ-administratie. De kadastrale aanduiding heeft immers een relatie naar het WOZ-object, i.c. het verblijfsobject en daardoor ook met een of meer panden in de BAG. Hetzelfde pand zit met geometrie op maaiveldniveau in de BGT. Vervolgens wordt deze BGT(maaiveld)geometrie van de relevante pand(en) opgehaald voor het op de kaart plaatsen van de tekening.

8. Rubber sheeting.

Met deze functie kunnen de bouwlagen (bijna) perfect worden ingepast binnen de BGT-omtrek (het BGT pandcontour). Dit matchen gebeurt met twee soorten “pins”. De feature-pin om muren mee te trekken en de rubber-pin om scanfouten te corrigeren.

9. Verblijfsobjecten

In dit stadium worden verblijfsobjecten gevormd op basis van ruimtetypes, appartementsindexnummers en relaties in de WOZ database.

10. Gebouwzones

Het vormen van bouwzones op basis van ruimtetypes, bouwlagen en verblijfsobjecten.

11. WOZ-objecten

In dit belangrijke stadium worden WOZ-objecten gevormd.

12. Overzicht en download

Deze database toont de gevonden WOZ-objecten, uitgesplitst in gebouwzones, ruimtes en andere objecten, zoals gebouwcomponenten en tuinen. Voor elk object wordt zijn bruto-vloeroppervlakte getoond berekend op basis van de geometrie.

Voorts is er een overzicht van de gevonden panden en verblijfsobjecten, uitgesplitst in gebouwzones, ruimtes en bijhorende andere objecten zoals gebouwcomponenten en tuinen.

13. Bouwlaaghoogte

In dit stadium wordt de bouwlaaghoogte geschat om de 3D geometrie van de ruimtes te berekenen. PDF2GIS gebruikt hiervoor het bestaande 3D model van de buitenkant van het pand.

14. 3D model

Op dit scherm kun je het uiteindelijke 3D model van het gebouw bekijken en exporteren.

15. Administratiepanel.

Het administratiepanel kan tot slot worden gebruikt om het gebruikersbestand aan te passen en om de tekeningen toe te kennen aan gebruikers voor verwerking.

Tot slot

De Wet waarde onroerende zaken heeft veel in beweging gebracht. Niet in de laatste plaats de noodzaak om de informatie voor volwaardige taxaties op orde te krijgen. Dit is een nieuw gegeven, omdat dit dwingt tot andere werkwijzen en gedachten met betrekking tot digitalisering. Het vraagt nu meer dan het digitaal archiveren van documenten, wat alleen maar leidt tot een verzameling van slecht doorzoekbare en statische plaatjes. PDF2GIS daarentegen digitaliseert tekeningen naar een gedetailleerde database met 3D-modellen, die je op verschillende manieren kan bevragen. PDF2GIS is met name ontwikkeld voor het verbeteren van de data-kwaliteit voor het WOZ-proces.

En wat levert het op? Niet alleen een substantiële reductie in de benodigde verwerkingstijd van de splitsingstekeningen (met een factor 3), maar vooral dat uiteindelijk de applicatie 4WOZ gevuld is met WOZ-objecten en WOZ-deelobjecten met de gewenste verbeterde gegevenskwaliteit.