Esperienze di trattamento di dati testuali di interesse sanitario

Pubblicato il 09/04/2018 SICUREZZA

a cura di: Manuela Orengia

Negli ultimi anni si stanno diffondendo metodi e strumenti per l’analisi e l’estrazione di conoscenza a partire non solo da dati strutturati in forma tabellare o relazionale ma anche da informazioni in forma testuale.

Presso il Servizio di epidemiologia - ASL TO3, alcune attività sono state svolte, in collaborazione con il Dipartimento di Informatica, utilizzando dati testuali presenti nei Flussi Sanitari correnti (accessi ai Pronto Soccorso) e nel sistema SINIACA - IDB (Sistema Informativo Nazionale Incidenti in Ambienti di Civile Abitazione - Injury DataBase).

Le tecniche di text-mining utilizzate riguardano il NLP - Natural Language Processing, con l’obiettivo della comprensione sintattica e semantica di un testo.

In particolare, a partire dalla componente testuale, si è cercato di determinare algoritmi di riconoscimento e classificazione di fenomeni violenti; si è cercato inoltre di valutare i meccanismi che influenzano, in operatori umani, la classificazione dei fenomeni violenti e di misurare se e in quale misura la modifica della struttura semantica abbia delle ripercussioni sul meccanismo di classificazione.

Le attività presso il Sepi hanno interessato i gruppi di progetto ‘Incidentalità, traumatologia e sicurezza’ e ‘Amministrazione e sviluppo di sistemi informativi sanitari'. Gli operatori di tali gruppi sono disponibili a divulgare il materiale disponibile, fra cui 2 tesi di laurea in Informatica e una tesi di master di I livello in Analisi dati per la business intelligence e data science. Il 26 marzo si è svolto presso il Sepi un seminario  di presentazione della tesi di Master.




Altre notizie nella sezione