Zoals een aantal van jullie weten wordt momenteel voor het OpenStreetPhoto project software ontwikkeld dat borden op straat kan herkennen. Nu is zoals bij veel projecten ‘bronmateriaal’ nogal schaars.
Tijs is momenteel bezig met een basis herkenner. Ik zou me kunnen voorstellen dat meer mensen eens willen pielen met OpenCV of in The Gimp met wat mooie Python filters. Daarom heb ik op de OpenStreetMap mirror mijn telefoon leeggegooid. M’n Amaryllo is de laatste tijd soms wat raar met opslaan van data, dus nog geen foto annotatie.
Omdat het erg handig is de algoritmes te vergelijken met hoge en lage resolutie, dan ook twee datasets.
Dan zal ik ook eens laten zien waar ik sta.
Ik gebruik nu 64x64x64 color histograms in YCbCr space. Ik heb 75 foto’s van straatnaamborden genomen met mijn camera en telefoon. De straatnaamborden zijn gelabeled door er nauwkeurig polygonen omheen te trekken. De kleuren van pixels binnen de polygonen worden gebruikt voor het ‘positive sample’ histogram. De kleuren buiten de polygonen worden gebruikt voor het ‘negative sample’ histogram. Een pixel wordt aangemerkt als de kleur van die pixel minimaal 3x zo vaak in de positieve samples dan in de negatieve samples voorkomt. Eerder gebruikte ik minder nauwkeurige labeling en een aparte set foto’s zonder borden er op voor de negative sample, maar dit gaf aanmerkelijk minder goede resultaten.
Zie hier de resultaten op Stefans’ set, en hier de resultaten op een aantal foto’s uit een eigen testset.
Met verdere segmentatie / classificatiemethode ben ik optimistisch dat het gaat lukken om verkeersborden te segmenteren. Daarnaast zal de nauwkeurigheid van de histogram matching methode toenemen naarmate ik meer straatnaamborden toevoeg. Meer fotosets van straatnaamborden zijn welkom!