test
Search publications, data, projects and authors

Free full text available

Preprint

French

ID: <

10670/1.v7goz4

>

Where these data come from
Anonymisation de corpus réutilisables Anonymisation de corpus réutilisables: Masquer l'identité sans altérer l'analyse des interactions

Abstract

Soumis à la conférence EIAH'2007 : Environnements Informatiques pour l'Apprentissage Humain, accepté en Poster. Cette version est la version de 12 pages soumise. La mise à disposition de corpus de traces issues de formations en ligne intéresse la communauté scientifique dans sa démarche d'analyse des interactions humaines produites à travers le dispositif médiatisé. Pour des raisons éthiques, les échanges de corpus doivent garantir l'anonymat des acteurs concernés. Ce travail s'intéresse au processus d'anonymi¬sation d'un corpus pour en permettre un accès plus large. Les principes et l'outil d'anonymisation présentés sont appliqués à un corpus d'interactions en apprentissage des langues. Dans de telles situations, les marques d'identité à masquer sont tantôt des identifiants immuables produits par le système, tantôt des appellations ou interpellations produites par les acteurs eux-mêmes et sujettes à des variations syntaxiques parfois signifiantes et empreintes de culture (surnoms, diminutifs). Enfin, cette contribution pose la question de la frontière à définir entre le contexte socioculturel utile à l'analyse et l'identité de l'acteur à protéger.

Your Feedback

Please give us your feedback and help us make GoTriple better.
Fill in our satisfaction questionnaire and tell us what you like about GoTriple!