Triunfo, Nicole (2013) Produzione di informazione statistica ufficiale: il ruolo dei dati testuali. [Tesi di dottorato]

[thumbnail of tesi finale.pdf]
Preview
Text
tesi finale.pdf

Download (1MB) | Preview
Item Type: Tesi di dottorato
Resource language: Italiano
Title: Produzione di informazione statistica ufficiale: il ruolo dei dati testuali
Creators:
Creators
Email
Triunfo, Nicole
nicole.triunfo@unina.it
Date: 1 April 2013
Number of Pages: 132
Institution: Università degli Studi di Napoli Federico II
Department: Matematica e statistica
Scuola di dottorato: Scienze economiche e statistiche
Dottorato: Statistica
Ciclo di dottorato: 25
Coordinatore del Corso di dottorato:
nome
email
Lauro, Carlo Natale
clauro@unina.it
Tutor:
nome
email
Balbi, Simona
sb@unina.it
Date: 1 April 2013
Number of Pages: 132
Keywords: text mining, text classification, fonti secondarie
Settori scientifico-disciplinari del MIUR: Area 13 - Scienze economiche e statistiche > SECS-S/01 - Statistica
Aree tematiche (7° programma Quadro): SCIENZE SOCIOECONOMICHE E UMANISTICHE > Crescita, impiego e competitività in una società della conoscenza
Date Deposited: 12 Apr 2013 13:07
Last Modified: 24 Jul 2014 06:44
URI: http://www.fedoa.unina.it/id/eprint/9520
DOI: 10.6092/UNINA/FEDOA/9520

Collection description

L'incessante sviluppo tecnologico e la crescente diffusione di dispositivi collegabili alla rete Internet sta creando una nuova miniera informativa utile per la produzione di informazioni. Le nuove tecnologie di comunicazione offrono opportunità di raccolta di dati semplificate che dovrebbero ridurre l'onere statistico gravante sulle imprese e migliorare la qualità delle informazioni statistiche. L'uso di queste fonti rappresenta una grande opportunità per gli istituti nazionali di statistica ancora non sufficientemente sfruttata a causa dei problemi connessi alla raccolta dei dati. Per contribuire al raggiungimento di questo obiettivo questo lavoro di tesi propone strumenti di text mining utili a facilitare il maggiore uso dei documenti espressi in linguaggio naturale. In particolare è stato proposto l'uso dell'analisi delle corrispondenze lessicali unitamente alla network analysis per la costruzione di risorse statistico linguistiche. Inoltre è stata proposta una strategia di text classification, per la costruzione di strumenti di interrogazione di testi: le query testuali. In ultimo, è stata proposto l'uso di un metodo fattoriale vincolato (analisi delle corrispondenze canoniche), per una analisi congiunta di variabili quantitative e testuali. Questo strumento consente di arricchire e comprendere i dati numerici con l'ausilio di dati testuali (parole). A titolo di esempio sono presentate alcune applicazioni a dati reali.

Downloads

Downloads per month over past year

Actions (login required)

View Item View Item