Abstract
I corpora di parlato sono raccolte di testi basate sulla resa grafica di quanto percepito dai trascrittori, prima ancora che riproposizioni di quanto detto dagli informanti. Riconoscerlo implica prestare attenzione tanto alle fasi di registrazione, quanto a quelle di riproduzione del parlato, ugualmente influenti sull’ascolto e quindi sul risultato finale della trascrizione. Nel contributo si affrontano i principali problemi che ne conseguono, proponendo laddove possibili soluzioni da condividere.
Speech corpora are collections of texts based on the written rendering of what is perceived by transcribers and not what is said by speakers. Recognizing this implies paying attention to both the recording and the reproduction phases of speech, which are equally influential on listening and therefore on the final result of transcription. The contribution deals with the main problems arising from this, proposing solutions to be shared wherever possible.