Classificazione e analisi di dati testuali

Descrizione della tecnologia

L’oggetto dell’invenzione consiste in un sistema di archiviazione e di analisi di testi mediante un classificatore ed un implementatore basato su machine learning di tipo statistico, sviluppato per essere in grado di produrre risultati anche con un numero di dati molto limitato ad esempio l'archiviazione e l'analisi di lingue in decadimento e del loro patrimonio culturale. L'archiviazione dei dati testuali avviene in un sistema di basi di dati misto e stratificato (SQL e NoSQL) per adattarsi facilmente ad altri ambiti che non siano solamente l'analisi linguistica, la corpus linguistics o la computational linguistics, ma una qualsiasi analisi che preveda algoritmi di distribuzione, loop predittivi, analisi statistiche, ecc. Ad esempio si stanno valutando applicazioni in ambito medico (digitalizzazione delle anamnesi) e gestionale (business intelligence).

Applicazioni
  • Corpus linguistics
  • Content analysis
  • Social network analytics
  • Sentiment analysis
  • Data retrieval
  • Data mining
Vantaggi
  • Prima piattaforma di corpus linguistics sviluppata per le lingue minoritarie ed in decadimento
  • Sistema di archiviazione dei file stratificato e frammentato, studiato per non richiedere elevata potenza di calcolo
  • Piattaforma veloce e flessibile
Inventori
  • Marco Bellante
  • Livio Gaeta
  • Raffaele Cioffi
  • Marco Angster
Data e numero primo deposito

Data: 21/11/2019

Numero: 102019000021837

Disponibile

SI

Titolarità

Università degli Studi di Torino

Ultimo aggiornamento: 24/01/2022