Classificazione e analisi di dati testuali
L’oggetto dell’invenzione consiste in un sistema di archiviazione e di analisi di testi mediante un classificatore ed un implementatore basato su machine learning di tipo statistico, sviluppato per essere in grado di produrre risultati anche con un numero di dati molto limitato ad esempio l'archiviazione e l'analisi di lingue in decadimento e del loro patrimonio culturale. L'archiviazione dei dati testuali avviene in un sistema di basi di dati misto e stratificato (SQL e NoSQL) per adattarsi facilmente ad altri ambiti che non siano solamente l'analisi linguistica, la corpus linguistics o la computational linguistics, ma una qualsiasi analisi che preveda algoritmi di distribuzione, loop predittivi, analisi statistiche, ecc. Ad esempio si stanno valutando applicazioni in ambito medico (digitalizzazione delle anamnesi) e gestionale (business intelligence).
- Corpus linguistics
- Content analysis
- Social network analytics
- Sentiment analysis
- Data retrieval
- Data mining
- Prima piattaforma di corpus linguistics sviluppata per le lingue minoritarie ed in decadimento
- Sistema di archiviazione dei file stratificato e frammentato, studiato per non richiedere elevata potenza di calcolo
- Piattaforma veloce e flessibile
- Marco Bellante
- Livio Gaeta
- Raffaele Cioffi
- Marco Angster
Data: 21/11/2019
Numero: 102019000021837
SI
Università degli Studi di Torino