Del Mondo, Carmine
(2008)
PDM: Predator Data Mining
Un nuovo approccio al Data Mining Unsupervised.
[Tesi di dottorato]
(Unpublished)
Item Type: |
Tesi di dottorato
|
Resource language: |
Italiano |
Title: |
PDM: Predator Data Mining
Un nuovo approccio al Data Mining Unsupervised |
Creators: |
Creators | Email |
---|
Del Mondo, Carmine | c_delmondo@alice.it |
|
Date: |
24 December 2008 |
Institution: |
Università degli Studi di Napoli Federico II |
Department: |
Matematica e applicazioni "Renato Caccioppoli" |
Scuola di dottorato: |
Scienze computationali ed informatiche |
Dottorato: |
Scienze computazionali e informatiche |
Ciclo di dottorato: |
21 |
Coordinatore del Corso di dottorato: |
nome | email |
---|
Ricciardi, Luigi Maria | UNSPECIFIED |
|
Tutor: |
nome | email |
---|
Trautteur, Giuseppe | trau@na.infn.it |
|
Date: |
24 December 2008 |
Keywords: |
Data Mining Unsupervised, Clustering, Missing Value, Microarray |
Settori scientifico-disciplinari del MIUR: |
Area 01 - Scienze matematiche e informatiche > INF/01 - Informatica |
[error in script]
[error in script]
Date Deposited: |
19 Nov 2009 08:50 |
Last Modified: |
30 Apr 2014 19:37 |
URI: |
http://www.fedoa.unina.it/id/eprint/3481 |
DOI: |
10.6092/UNINA/FEDOA/3481 |

Collection description
Si presenta in questa tesi un nuovo algoritmo adatto alla soluzione di un ampia categoria
di problemi di data mining unsupervised: il PDM (Predator Data Mining).
Il PDM determina dei buoni centri di aggregazione dell’insieme dei dati classificandoli
rispetto ad essi. I centri di aggregazione possono essere i classici centroidi, o strutture
pi`u o meno complesse. Queste possono immagazzinare, e quindi permettere di estrarre,
maggiori, o comunque diverse informazioni rispetto alla classica operazione di data
clustering, che `e comunque un caso particolare del PDM
L’algoritmo sfrutta un approccio originale al problema che consiste nell’estrarre informazioni
dall’insieme di dati, che vengono considerate come risorse per un insieme
parallelo di “predatori”. Gli insiemi di predatori sono generati da un particolare algoritmo
evolutivo chiamato Competitive Evoluntion on Data (CED). L’insieme dei dati viene
visto dal CED come un insieme di risorse: un ambiente, all’interno del quale popolazioni
di predatori competono. Il PDM, tramite tecniche di data clustering, estrae, da alcune
delle popolazioni generate dalla dinamica evolutiva del CED, i predatori che ritiene pi`u
significativi, la metrica utilizzata tra i predatori è definita intrinsicamente nell’algoritmo
ed è indipendente dal particolare predatore adottato.
In questa tesi si è rivolta l’attenzione ad un particolare tipo di dati (punti in Rn, si
sono fatti vedere alcuni esempi di utilizzo con classe di predatori differente, usandolo
come classico algoritmo di Data Clustering lo si è confrontato su alcuni data set che simulano
l’espressione genetica dei geni (microarray) con gli algoritmi più frequentemente
usati in quest’ambito, ed infine si `e applicato il PDM su un data base reale confrontando i
risultati con quelli ottenuti e pubblicati sullo stesso con altri procedimenti.
Inoltre, nell’acquisizione degli strumenti necessari per l’elaborazione dell’algoritmo,
si sono fatte alcune considerazioni significative sui coefficienti utilizzati per confrontare
classificazioni. In pratica si associa ad un risultato di un operazione di clustering un classificatore
booleano, chiamato di accoppiamento, che unifica i coefficienti utilizzati nel
confronto tra classificazioni unsupervised con quelli utilizzati tra classificazioni supervised.
Questa unificazione permette tra l’altro di definire nuovi coefficienti che hanno
interessanti caratteristiche.
Downloads per month over past year
Actions (login required)
 |
View Item |