RECUNOAŞTEREA FORMELOR ŞI CLASIFICAREA AUTOMATĂ A IMAGINILOR, O MODELARE ÎN PATRU PAŞI. Ioan ISPAS. Abstract

Similar documents
Modelare şi modele matematice în recunoaşterea obiectelor şi clasificarea automată a imaginilor

GRAFURI NEORIENTATE. 1. Notiunea de graf neorientat

VISUAL FOX PRO VIDEOFORMATE ŞI RAPOARTE. Se deschide proiectul Documents->Forms->Form Wizard->One-to-many Form Wizard

Pasul 2. Desaturaţi imaginea. image>adjustments>desaturate sau Ctrl+Shift+I

Aplicatii ale programarii grafice in experimentele de FIZICĂ

Ghid de instalare pentru program NPD RO

INTER GENRE SIMILARITY MODELLING FOR AUTOMATIC MUSIC GENRE CLASSIFICATION

Click pe More options sub simbolul telefon (în centru spre stânga) dacă sistemul nu a fost deja configurat.

Reducing False Positives in Video Shot Detection

MUSI-6201 Computational Music Analysis

Conferinţa Naţională de Învăţământ Virtual, ediţia a IV-a, Graph Magics. Dumitru Ciubatîi Universitatea din Bucureşti,

Paulo V. K. Borges. Flat 1, 50A, Cephas Av. London, UK, E1 4AR (+44) PRESENTATION

Parcurgerea arborilor binari şi aplicaţii

Platformă de e-learning și curriculă e-content pentru învățământul superior tehnic

6. MPEG2. Prezentare. Cerinţe principale:

ZOOLOGY AND IDIOMATIC EXPRESSIONS

Exerciţii Capitolul 4

PREZENTARE INTERFAŢĂ MICROSOFT EXCEL 2007

Geographical data management in GIS systems

Modalităţi de redare a conţinutului 3D prin intermediul unui proiector BenQ:

SUBIECTE CONCURS ADMITERE TEST GRILĂ DE VERIFICARE A CUNOŞTINŢELOR FILIERA DIRECTĂ VARIANTA 1

Shot Transition Detection Scheme: Based on Correlation Tracking Check for MB-Based Video Sequences

Wipe Scene Change Detection in Video Sequences

A Framework for Segmentation of Interview Videos

Evaluation of Automatic Shot Boundary Detection on a Large Video Test Suite

A REVIEW ON PRINTED MUSIC RECOGNITION SYSTEM DEVELOPED IN INSTITUTE OF COMPUTER SCIENCE IAŞI

VISUAL CONTENT BASED SEGMENTATION OF TALK & GAME SHOWS. O. Javed, S. Khan, Z. Rasheed, M.Shah. {ojaved, khan, zrasheed,


Principles of Video Segmentation Scenarios

Mail Moldtelecom. Microsoft Outlook Google Android Thunderbird Microsoft Outlook

Man-Machine-Interface (Video) Nataliya Nadtoka coach: Jens Bialkowski

1. Ecuaţii diferenţiale de ordinul întâi

Automatic Piano Music Transcription

Teoreme de Analiză Matematică - II (teorema Borel - Lebesgue) 1

TTX260 investiţie cu cost redus, performanţă bună

Smart Traffic Control System Using Image Processing

AUDIO FEATURE EXTRACTION AND ANALYSIS FOR SCENE SEGMENTATION AND CLASSIFICATION

Platformă de e-learning și curriculă e-content pentru învățământul superior tehnic

22METS. 2. In the pattern below, which number belongs in the box? 0,5,4,9,8,13,12,17,16, A 15 B 19 C 20 D 21

Anexa 2. Instrumente informatice pentru statistică

Development of an Optical Music Recognizer (O.M.R.).

Incorporating Domain Knowledge with Video and Voice Data Analysis in News Broadcasts

APPLICATIONS OF DIGITAL IMAGE ENHANCEMENT TECHNIQUES FOR IMPROVED

ECG Denoising Using Singular Value Decomposition

DETECTION OF SLOW-MOTION REPLAY SEGMENTS IN SPORTS VIDEO FOR HIGHLIGHTS GENERATION

Research Article. ISSN (Print) *Corresponding author Shireen Fathima

TERRESTRIAL broadcasting of digital television (DTV)

ARHITECTURA SISTEMELOR DE CALCUL ŞI SISTEME DE OPERARE. LUCRĂRILE DE LABORATOR Nr. 12, 13 şi 14

Audio-Based Video Editing with Two-Channel Microphone

Name Identification of People in News Video by Face Matching

A QUERY BY EXAMPLE MUSIC RETRIEVAL ALGORITHM

Marketing politic. CURS (tematică & bibliografie) Specializarea Ştiinţe Politice, anul III

BBM 413 Fundamentals of Image Processing Dec. 11, Erkut Erdem Dept. of Computer Engineering Hacettepe University. Segmentation Part 1

Automatic Music Clustering using Audio Attributes

Speech To Song Classification

A simplified fractal image compression algorithm

2. Problem formulation

Distortion Analysis Of Tamil Language Characters Recognition

TRAFFIC SURVEILLANCE VIDEO MANAGEMENT SYSTEM

Criterii pentru validarea tezelor de doctorat începute în anul universitar 2011/2012

Fast thumbnail generation for MPEG video by using a multiple-symbol lookup table

Music Emotion Recognition. Jaesung Lee. Chung-Ang University

Automatic Labelling of tabla signals

ROBUST ADAPTIVE INTRA REFRESH FOR MULTIVIEW VIDEO

LESSON FOURTEEN

Music Source Separation

Browsing News and Talk Video on a Consumer Electronics Platform Using Face Detection

Automatic LP Digitalization Spring Group 6: Michael Sibley, Alexander Su, Daphne Tsatsoulis {msibley, ahs1,

Clasele de asigurare. Legea 237/2015 Anexa nr. 1

Automatic Laughter Detection

Chord Classification of an Audio Signal using Artificial Neural Network

Primitive segmentation in old handwritten music scores

19 th INTERNATIONAL CONGRESS ON ACOUSTICS MADRID, 2-7 SEPTEMBER 2007

A Parametric Autoregressive Model for the Extraction of Electric Network Frequency Fluctuations in Audio Forensic Authentication

An Empirical Study on Identification of Strokes and their Significance in Script Identification

Problem. Objective. Presentation Preview. Prior Work in Use of Color Segmentation. Prior Work in Face Detection & Recognition

Acoustic Scene Classification

Split Screen Specifications

Analysis of Visual Similarity in News Videos with Robust and Memory-Efficient Image Retrieval

Color Image Compression Using Colorization Based On Coding Technique

A Novel Approach towards Video Compression for Mobile Internet using Transform Domain Technique

Improving Frame Based Automatic Laughter Detection

Press review. Monitorizare presa. Programul de responsabilitate sociala. Lumea ta? Curata! TIMISOARA Page1

Story Tracking in Video News Broadcasts. Ph.D. Dissertation Jedrzej Miadowicz June 4, 2004

THE importance of music content analysis for musical

EMBEDDED ZEROTREE WAVELET CODING WITH JOINT HUFFMAN AND ARITHMETIC CODING

A Categorical Approach for Recognizing Emotional Effects of Music

Outline. Why do we classify? Audio Classification

Maria plays basketball. We live in Australia.

IMPROVING SIGNAL DETECTION IN SOFTWARE-BASED FACIAL EXPRESSION ANALYSIS

Research Topic. Error Concealment Techniques in H.264/AVC for Wireless Video Transmission in Mobile Networks

... A Pseudo-Statistical Approach to Commercial Boundary Detection. Prasanna V Rangarajan Dept of Electrical Engineering Columbia University

OPTIMIZAREA GRADULUI DE ÎNCĂRCARE AL UTILAJELOR DE FABRICAŢIE OPTIMIZING THE MANUFACTURING EQUIPMENTS LOAD FACTOR

Detection of Panoramic Takes in Soccer Videos Using Phase Correlation and Boosting

International Journal of Advance Engineering and Research Development MUSICAL INSTRUMENT IDENTIFICATION AND STATUS FINDING WITH MFCC

Essence of Image and Video

Diagnoza sistemelor tehnice

FIŞA DISCIPLINEI. Facultatea de Electronică, Telecomunicaţii şi Tehnologia Informaţiei 1.3 Departamentul Bazele Electronicii 1.4 Domeniul de studii

WE ADDRESS the development of a novel computational

Image Steganalysis: Challenges

Transcription:

RECUNOAŞTEREA FORMELOR ŞI CLASIFICAREA AUTOMATĂ A IMAGINILOR, O MODELARE ÎN PATRU PAŞI Ioan ISPAS Abstract Problema clasificării automate a imaginilor pe baza recunoaşterii formelor din imagini este o problemă de importanţă strategică în multe domenii de mare interes. Sistematizarea metodelor şi informaţiilor care tratează acest subiect este un demers foarte dificl dar în acelaşi timp necesar. Contribuţia noastră este tocmai realizarea acestui efort ce permite o viziune de ansamblu asupra problemei studiate şi creează premisele pentru modelarea acesteia. Clasificarea automată a imaginilor este o problemă de importanţă strategică în multe domenii de mare interes. Rezolvarea ei se bazează pe metodele de recunoaştere a formelor sau a conţinutului din imagini. Demersul original al acestor pagini este de a sistematiza mulţimea abordărilor existente pentru a permite obţinerea unei baze în vederea modelării acestei probleme. Parcurgând atent literatura de specialitate putem concluziona că recunoaşterea şi clasificarea imaginilor este un proces ce se desfăşoară în patru paşi etape - esenţiali şi inevitabili. Evidenţierea acestor patru etape ale procesului de recunoaştere şi clasificare a imaginilor permite apoi sistematizarea garadată a tuturor metodelor existente. Schema procesului de recunoaştere şi clasificare automată a imaginilor este următoarea: I m a gi n e I. Preproce sarea imagi nii II. Extragerea atributelor, descriptori -lor de imagine III. Măsurarea atributelor sau descriptoril or IV. Clasificarea imaginii I. Preprocesarea imaginii. Prin această etapă de preprocesare se înţelege de fapt aplicarea, unor algoritmi DIP specializaţi de îmbunătăţire a calităţii imaginii. II. Extragerea atributelor sau descriptorilor de imagine (feature extraction). Este etapa cheie, este cea care dă măsura performanţelor şi a profesionalismului aplicaţiei de 724

recunoaştere. Alegerea unor atribute sau caracteristici cît mai potrivite este cheia succesului algoritmilor de recunoaştere. Rezultatul final al acestei etape este un vector de n atribute extrase (v1, v2,, vn) nu neapărat numerice. III. Măsurarea atributelor sau descriptorilor (feature/pattern measurement). Această etapă este bine tratată teoretic deoarece există un aparat matematic bine pus la punct Teoria măsurii cu ajutorul căruia se pot introduce diferite metrici n-dimensionale sau metode discriminative eficiente. Rezultatul final al acestei etape este de obicei o valoare numerică uni- sau multi-dimensională (un vector) privită ca fiind "distanţa" vectorului de atribute faţă de graniţele regiunilor (borders) sau faţă de "bornele" de clasificare. IV. Clasificarea imaginii (pattern classification). Este etapa finală în care se colaborează rezultatele măsurătorilor multiple anterioare (realizate cu mai multe metrici diferite). Ea stabileşte apartenenţa formei, obiectului sau imaginii - descrise prin vectorul de atribute -la o clasă de imagini, pe baza unor criterii matematice sau funcţii de apartenenţă. Rezultatul final al etapei de clasificare este numărul C al clasei de apartenenţă sau direct denumirea ei. Pe baza paşilor III şi IV, literatura de specialitate grupează modelele şi metodele generale de recunoaştere şi clasificare în patru mari categorii sau strategii, denumite abordări (pattern recognition approaches) [2, pag.6] : A. Recunoaşterea prin potrivirea cea mai bună (template matching ; B. Recunoaşterea prin metode statistice (statistical ; C. Recunoaşterea cu ajutorul reţelelor neuronale (neural networks ; D. Recunoaşterea sintactică sau structurală (syntactic or structural ; Există şi o altă clasificare în doar două mari categorii [1, pag.xiv]: A. Recunoaşterea bazată pe metode teoretice de decizie (decision-theoretic methods); B. Recunoaşterea sintactică sau structurală (syntactic or structural methods); Tabelele ce urmează sintetizează şi descriu informaţiile despre cele patru strategii de modelare a problemei recunoaşterii şi clasificării automate a imaginilor. 725

Strategia de abordare / Modelarea matematică Potrivirea cea mai bună (Template matching Metode statistice (Statistical Reţele neuronale (Neural networks Sintactică / structurală (Syntactic / structural Modele de reprezentare a atributelor (descriptorilor) mostre de pixeli, contururi, forme valori numerice, contururi, forme forme şi mărimi numerice de antrenament şiruri de coduri (simboluri) Modele / funcţii de discriminare (recunoaştere) funcţia de corelaţie, diferite metrici funcţia de discriminare funcţie de decizie neuronală reguli de derivare (sintactice) Modele / criterii (condiţii) de discriminare Minimizarea erorii/maximiza re a potrivirii Minimizarea pierderii (riscului) Minimizarea erorii la învăţare arbore derivare sintactică de În articolele de specialitate pe această temă se oferă explicit strategiile de modelare folosite, numite tehnici, metode sau abordări. Astfel, [4] oferă trei strategii generale de recunoaştere şi regăsire a imaginilor: 1. the signature-based technique, 2. the partition-based approach, 3. the cluster-based approach. [5] propune o clasificare asemănătoare, tot în trei mari strategii: 1. text-based retrieval, 2. content-based retrieval, 3. semantic-based retrieval. Sunt trecute în revistă metodele utilizate de sistemele automate de recunoaştere şi regăsire a imaginilor existente pe piaţă. Există şase criterii generale de căutare /recunoaştere /regăsire: 1.Color Content (CC), 2.Shape Content (SC), 3.Texture Content (TC), 4.Color Structure (CS), 5.Brightness Structure (BS), 6. Aspect Ratio (AR). Există însă şi alte abordări, particulare [3]: Component Classification using Fuzzy Fpproach, User and Task-Based Approach, Contextual Clues and Automatic Pseudofeedback, Relevance Feedback, etc. 726

Etapa în procesul recunoaşterii Modelul /Strategia de abordare A. Potrivirea cea mai bună (Template matching B. Modelare prin metode statistice (Statistical C. Modelare prin reţele neuronale (Neural networks D. Modelare sintactică / structurală (Syntactic / structural I. Preprocesare a imaginii restaurarea imaginii, îmbunătăţirea calităţii, amplificarea contrastului; eliminarea paraziţilor şi a "zgomotului" (noise reduction); transformarea Fourier a imaginii, folosită mai ales pentru analizarea texturii algoritmi morfologici: dilatare, eroziune, umplere, înfăşurătoarea convexă, scheletizare; II. Extragerea atributelor (feature extraction) algoritmi de segmentare a imaginii: detectarea discontinuităţilor - puncte, linii, muchii (edges), conectarea segmentelor (edge linking), determinarea contururilor (boundries), filtre globale şi adaptative (thresholdings), histograma; algoritmi de reprezentare şi descriere a formelor: descrierea contururilor, momente statistice invariante, d scriptori Fouri r t xturi algoritmi de reprezentare şi descriere a formelor: înlănţuire de coduri, aproximări poligonale, semnături, descriptori topologici, shape numbers III. Măsurarea atributelor (feature measurement) algoritmi de determinare a potrivirii: minimum distance classifier, matching by correlation metode statistice de minimizare a pierderii (a riscului) (conditional average risk statistical equation) perceptroni, metode de antrenare, reţele neuronale multistrat, algoritmi de învăţare gramatici şi reguli de derivare sintactică, arbori de derivare (analiză) sintactică, automate finite de recunoaştere IV. Clasificarea (pattern classification) algoritmi de determinare a graniţei (decision boundary) între clase; Algoritmi /funcţii de discriminare statistică: funcţia Bayes (optimum statistical Bayes classifier); metode neuronale de antrenare şi învăţare, de exemplu training by back-propagation; metode de derivare şi analiză sintactică a şirurilor de coduri (scanning); 727

Fără a epuiza subiectul, în lista următoare apar înşirate alte metode /tehnici /algoritmi folosiţi în recunoaştere şi clasificare [7, 8, 9, 10, 11, 12]. Ele combină strategiile de mai sus sau introduc abordări noi, particulare: Fourier transform for segmentation, Wavelets analysis methods, Multi-level color histogram, Similarity Measure methods, Dominant color classification, Joint histograms, Edge angle distribution, 3D neighborhood graph model, Hough transform based methods, Data covariance matrix based methods, Connected component analysis, Statistical image differences methods, Degradation features based techniques, Clustering methods, Skew estimation methods, Skew detection using morphology, Classification and segmentation using support vector machines, Multilevel thresholding Region growing Complex background analysis, Regions of interest based methods, Classification and segmentation using boundary characteristics, etc. Concluzii Problema recunoaşterii formelor s-a combinat cu problema clasificării automată a imaginilor odată cu dezvoltarea deosebită luată de tehnologiile multimedia şi de Internet. Din perspectiva modelării matematice fundamental, această problemă este - într-o mare măsură - o problemă deschisă. Cea mai bună dovadă este faptul că, după atâţia ani de eforturi asidue, nu se cunoaşte o metodă sau o aplicaţie soft de referinţă pentru rezolvarea ei. Există în schimb, aşa cum se poate observa şi în aceste pagini, o mulţime numeroasă de modele /abordări /strategii /metode şi algoritmi. Ele atacă soluţionarea problemei din perspective variate, majoritatea particulare. Niciuna dintre abordări nu conduce însă la o eficienţă foarte bună în soluţionarea problemei recunoaşterii /regăsirii automate a imaginilor. Lucrarea de faţă sintetizează, grupează şi clasifică cea mai mare parte a modelelor /strategiilor existente pentru a creea premisele necesare modelării matematice a Problemei recunoaşterii formelor şi clasificării automate a imaginilor. 728

BIBLIOGRAFIE [1] - GONZALEZ R., WOODS R. - Digital Image Processing, Prentice Hall, 2002, 2 nd Edit. [2] A. JAIN, R. DUIN, J. MAO Statistical Pattern Recognition: A Review, IEEE Transactions On Pattern Analysis and Machine Intelligence, Vol. 22, No. 1, January 2000 [3] IOAN ISPAS Algoritmi de recunoaşterea formelor şi clasificarea automată a imaginilor, Referat, Univ. Babeş-Bolyai, Facultatea de Matematică-Informatică, Cluj-Napoca, 2004 [4] KIAN-LEE TAN, BENG CHIN OOI, CHIA YEOW YEE - An Evaluation of Color-Spatial Retrieval Techniques for Large Image Databases, Multimedia Tools and Applications, 14, 55 78, 2001, Kluwer Academic Publishers [5] MARJO MARKKULA, EERO SORMUNEN, MARIUS TICO, BEMMU SEPPONEN AND KATJA NIRKKONEN - A Test Collection for the Evaluation of Content-Based Image Retrieval Algorithms - A User and Task-Based Approach, Information Retrieval, 4, 275 293, 2001, Kluwer Academic Publishers [6] OGE MARQUES, BORKO FURHT MUSE: A Content-Based Image Search and Retrieval System Using Relevance Feedback, Multimedia Tools and Aplications, 17, 21-50, 2002, Kluwer Academic Publishers [7] Y. ALP ASLANDOGAN, CLEMENT T. YU, RAVISHANKAR MYSORE, BO LIU - Robust content-based image indexing using contextual clues and automatic pseudofeedback, Multimedia Systems 9: 548 560 Springer-Verlag 2004 [8] KIAN-LEE TAN, BENG CHIN OOI, CHIA YEOW YEE - An Evaluation of Color-Spatial Retrieval Techniques for Large Image Databases, Multimedia Tools and Applications, 14, 55 78, 2001, Kluwer Academic Publishers. [9] A. SRIVASTAVA, A.B. LEE, E.P. SIMONCELLI, S.-C. ZHU - On Advances in Statistical Modeling of Natural Images, Journal of Mathematical Imaging and Vision 18: 17 33, 2003 Kluwer Academic Publishers. 729

[10] JO RG DAHMEN, DANIEL KEYSERS, HERMANN NEY AND MARK OLIVER GU LD - Statistical Image Object Recognition using Mixture Densities, Journal of Mathematical Imaging and Vision 14: 285 296, 2001, Kluwer Academic Publishers [11] MARTIN HECZKO, ALEXANDER HINNEBURG, DANIEL KEIM, MARKUSWAWRYNIUK - Multiresolution similarity search in image databases, Digital Object Identifier (DOI) 10.1007/s00530-004-0135-6, Multimedia Systems 10: 28 40, Springer-Verlag 2004 [12] WEI-YING MA, B. S. MANJUNATH - NeTra: A toolbox for navigating large image databases, Multimedia Systems 7: 184 198 (1999) Multimedia Systems, Springer-Verlag, 1999 730