In questo lavoro viene proposto un approccio innovativo all'indicizzazione di sequenze video basato sull'analisi dello stream audio sottostante. I metodi implementati permettono di segmentare l'audio in un insieme di classi immagine con elevato contenuto semantico. Ciò consente di individuare situazioni altamente significative solamente informazioni estratte attraverso l'elaborazione del segnale audio. Per far questo è stato sviluppato un algoritmo di segmentazione dell'audio in quattro classi omogenee (silenzio, voce, musica, rumore) basato sull'analisi di semplici caratteristiche temporali e frequenziali.
Indicizzazione di sequenze video attraverso l'analisi dell'audio sottostante
BUGATTI, Alessandro;LEONARDI, Riccardo;MIGLIORATI, Pierangelo;ROSSI, Lorenzo
2000-01-01
Abstract
In questo lavoro viene proposto un approccio innovativo all'indicizzazione di sequenze video basato sull'analisi dello stream audio sottostante. I metodi implementati permettono di segmentare l'audio in un insieme di classi immagine con elevato contenuto semantico. Ciò consente di individuare situazioni altamente significative solamente informazioni estratte attraverso l'elaborazione del segnale audio. Per far questo è stato sviluppato un algoritmo di segmentazione dell'audio in quattro classi omogenee (silenzio, voce, musica, rumore) basato sull'analisi di semplici caratteristiche temporali e frequenziali.File in questo prodotto:
File | Dimensione | Formato | |
---|---|---|---|
BLMR-2_UNIPD-2000_full-text SMALL.pdf
accesso aperto
Descrizione: BLMR-2_UNIPD-2000_full-text
Tipologia:
Full Text
Licenza:
PUBBLICO - Creative Commons 3.6
Dimensione
846.43 kB
Formato
Adobe PDF
|
846.43 kB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.