Forciniti, Alessia (2020) La Violenza contro le donne in Europa: una strategia di Cross-Language Analysis. [Tesi di dottorato]

[img]
Anteprima
Testo
AlessiaForciniti.pdf

Download (24MB) | Anteprima
[error in script] [error in script]
Tipologia del documento: Tesi di dottorato
Lingua: Italiano
Titolo: La Violenza contro le donne in Europa: una strategia di Cross-Language Analysis
Autori:
AutoreEmail
Forciniti, Alessiaalessia.forc@libero.it
Data: 2020
Numero di pagine: 360
Istituzione: Università degli Studi di Napoli Federico II
Dipartimento: Scienze Sociali
Dottorato: Scienze sociali e statistiche
Ciclo di dottorato: 32
Coordinatore del Corso di dottorato:
nomeemail
Serpieri, Robertoroberto.serpieri@unina.it
Tutor:
nomeemail
Scepi, Germana[non definito]
Morlicchio, Enrica[non definito]
Data: 2020
Numero di pagine: 360
Parole chiave: Cross-language study, Generalized Procrustes Analysis, Violenza contro le donne, Text Mining, Concepts Extraction
Settori scientifico-disciplinari del MIUR: Area 13 - Scienze economiche e statistiche > SECS-S/05 - Statistica sociale
Depositato il: 23 Mar 2020 08:48
Ultima modifica: 10 Nov 2021 09:33
URI: http://www.fedoa.unina.it/id/eprint/13105

Abstract

Il presente lavoro di tesi ha lo scopo di proporre una strategia statistica per l’analisi di linguaggi e culture differenti su uno dei più rilevanti fenomeni di violazione dei diritti umani: la violenza contro le donne. L’obiettivo è quello di evidenziare eventuali similarità e/o dissimilarità tra i registri linguistici, supponendo l’esistenza di un binomio lingua-cultura. L’utilizzo di tecniche di Text Mining ha consentito di condurre uno studio sui contenuti testuali estratti da Twitter in cinque diverse lingue europee: italiano, inglese, francese, spagnolo ed ucraino; il periodo di monitoraggio è compreso tra il primo maggio e il 31 ottobre 2019. I principali metodi e approcci della letteratura multilingue del dato testuale confrontano solo due lingue per volta tramite tecniche di traduzione automatica e l’uso di dizionari bilingue. In questo contesto invece per mantenere le peculiarità proprie di ogni lingua, è sembrato opportuno presentare un confronto multilingue diverso, ossia basato su un’unità di analisi di ordine concettuale: sono stati infatti individuati gruppi di concetti monolingue, classificando in cluster le diverse features (ovvero i termini estratti in uno spazio vettoriale multidimensionale). Nello specifico, per ottenere tali raggruppamenti si è inteso inizialmente assicurare l’orientamento semantico delle features, attraverso il calcolo della polarità semantica. L’assegnazione dei punteggi della polarità si è ottenuta utilizzando il lexicon multilingue NRC (National Research Council Canada) basando lo studio su una preliminare analisi esplorativa dei cinque corpora monolingue. Ogni collezione di dati monolingue è stata suddivisa in base alla polarità, creando così, attraverso l’utilizzo combinato di due tecniche di analisi multivariata: Analisi delle Corrispondenze e Cluster Analysis, la Concepts Extraction. Ne è derivato un raggruppamento di classi di concetti solo positivi e classi di concetti solo negativi. Più propriamente, sulle coordinate dell’Analisi delle Corrispondenze si è adottata una strategia di classificazione mista, che parte dal metodo gerarchico di Ward e si consolida con il metodo non gerarchico del k-means. Dalla Concepts Extraction si è evidenziata una chiave di lettura comune tra le lingue, rivelando un dominio semantico simile.Tuttavia, sebbene dall’Analisi Multivariata siano stati individuati raggruppamenti concettuali simili, si è ritenuto interessante evidenziare ulteriormente se i concetti individuati nei diversi linguaggi avessero relazioni simili tra loro. Nello specifico, si è voluta condurre un’Analisi Procustiana Generalizzata (GPA) per comparare simultaneamente in unico piano fattoriale le cinque configurazioni dei concetti e dare quindi un risultato di consensus o accordo tra le lingue. I risultati della GPA, derivanti dallo studio della rappresentazione fattoriale e dell’Analisi della Varianza (PANOVA) hanno permesso di cogliere similarità o dissimilarità tra le lingue ed individuare quindi quali concetti mettano più d’accordo l’opinione pubblica internazionale riguardo al tema preso in esame. In definitiva, la proiezione fattoriale dei concetti in un comune spazio multidimensionale cross-language e l’Analisi della Varianza hanno evidenziato un maggiore accordo sui concetti della misoginia, della discriminazione, del garantismo e dell’inefficacia giuridica, mentre hanno espresso un minore consenso in relazione all’attivismo, alla cooperazione e alla strumentalizzazione dei Social Media. La propensione alla semantica negativa accomuna in maggior misura le lingue indagate sul fenomeno della violenza contro le donne. Al contrario, i concetti positivi restituiscono il maggiore disaccordo. È altresì emerso che l’italiano e l’inglese sono più simili tra loro nelle relazioni tra i concetti mentre la lingua ucraina è risultata la più dissimile nel confronto multilingue. La proposta di analisi cross-language adottata si è rivelata particolarmente utile a definire un contesto europeo poco diversificato in termini di opinione pubblica sul fenomeno della violenza contro le donne, suggerendo una chiara e comune consapevolezza del problema e dei rischi. Al contempo, ha evidenziato invece una differente percezione circa la fiducia nelle attività di cooperazione e di azione sociale finalizzate alla trasformazione socio-culturale.

Downloads

Downloads per month over past year

Actions (login required)

Modifica documento Modifica documento