Ett nordiskt seminarium om teckenspråkskorpusar arrangerades i Köpenhamn 12-13 december 2013. Deltagare från fem nordiska länder berättade om hur de använder korpusar i sitt arbete. Arrangörer var det nordiska teckenspråksnätverket.
Syftet med seminariet var att diskutera hur språkkorpusar kan användas av olika yrkesgrupper, t.ex. forskare, språkvårdare, lexikografer, språklärare och tolkar, och se till att dessa erfarenheter ligger till grund för hur framtidens korpusar konstrueras. Intresset var mycket större än vad vi hade hoppats på. Omkring 40 personer kom till Professionshøjskolens lokaler i Köpenhamn. Seminariet sträckte sig över två halvdagar, där första dagen ägnades åt presentationer och andra dagen åt diskussioner.

Foto: O. Crasborn
Få länder har ännu tagit fram språkkorpusar för teckenspråk, så innehållet i presentationerna handlade också vilka förväntningar man har på korpusar eller att korpusprojekt nyligen kommit igång. Här följer en kort sammanfattning av varje presentation.
Kristina Nilsson Björkenstam, Institutionen för lingvistik vid Stockholms universitet, berättade om vilken information korpusar kan ge oss – men också inte ge – om språkbruket. Kristina forskar i kommunikationsmönster mellan mamma och spädbarn, och har varit med att utveckla ett multimodalt korpus för detta ändamål. Saker vi kan få reda på från en korpus är: hur vanligt ett ord är, kollokationer (hur ord grupperar sig med andra ord), dialekter och sociolekter. Men framför allt erbjuder korpusar återbrukbar kvanitativ data, som kan användas i flera studier. Vi fick höra exempel på udda korpusar, som till exempel det tyska The Alcohol Language Corpus, där man kan studera hur språkbruket påverkas av berusningsgraden.
Johanna Mesch, Teckenspråksavdelningen vid Stockholms universitet, berättade om det mödosamma arbetet med att skapa Svenskt teckenspråkskorpus, som publicerades i början av 2012. Det består av 25 timmar inspelade dialoger mellan infödda teckenspråkstalare. Hittills har man transkriberat omkring 20 procent av filmerna på gloss-nivå. I översättningsarbetet har man kommit längre. Korpusen används i forskning och i undervisning. Teckenspråksavdelningen har också påbörjat arbete med att ta fram en korpus med taktilt teckenspråk och en korpus med inspelningar av andraspråksinlärare.
Tommy Lyxell, Språkrådet, pekade på vilken hjälp korpusar kan ge vid språkrådgivning, t.ex. när man vill ta reda på hur sammansättningar uppför sig, hur teckenspråkliga konstruktioner ser ut och historiska förändringar i språkbruket. Men det finns också fallgropar att se upp för. Ofta får skrivna språket vara referenspunkten när teckenspråk diskuteras, såväl vid betydelsebestämning som vid glossning. Betydelsen hos tecken uttrycks på det skrivna språket, när det i själva verket är en översättning. Han gav exempel på tecken i Svenskt teckenspråkskorpus som beskrivs med olika glossor, och där betydelsen inte kan beskrivas med ett enda ord. Det ideala är att diskutera teckenspråk på teckenspråk, alltså enligt samma principer som för andra språk, menade Tommy Lyxell.
Thomas Troelsgård, Centre for Tegnsprog vid Professionshøjskolen UCC, visade hur korpusar används vid lexikografiskt arbete. Fördelen med korpusar är att man kan använda autentiskt språkligt material, vilket är ett viktigt stöd i den semantiska analysen. Korpusar ger oss möjligheter att studera större språkliga enheter än bara enstaka tecken. Det är också möjligt att använda exempelmeningar från det inspelade materialet. Nackdelen är att spontana inspelningarna ger upphov till uttalsvariationer och att det framgår vilka individer som talar. Dessa problem går att komma runt genom att skapa ett prototypiskt grundtecken med undergrupper av uttalsvariationer och låta en aktör framföra samma exempelmening i en nyinspelning.
Onno Crasborn, Radboud Universiteit i Nijmegen, lyfte fram hur teckenspråkstolkar kan dra nytta av korpusar. Det holländska teckenspråkskorpuset Corpus NGT lanserades i december 2008 och består av 72 timmar inspelat material, varav 12 timmar är transkriberat i dag. Corpus NGT används redan i tolkutbildningar. Verksamma tolkarna kan använda korpusar för att förbereda sig inför tolkuppdrag, t.ex. att ta reda på hur viss tecken används av olika grupper inom teckenspråkssamhället. Problemet är att korpusprogram oftast inte är användarvänliga, och det krävs kunskaper om hur man gör sökningar. Därför har man i Holland påbörjat ett arbete med att ta fram ett enklare sökgränssnitt. Onno Crasborn poängterade att korpusarbete är viktigt för att föra teckenspråken vidare in i den digitala tidsåldern. Finns inte språket i digital form, riskerar det att dö ut, var budskapet.
Som en sista punkt på torsdagseftermiddagen skulle Sanna Ala-Sippola, Leena Savolainen och Satu Worseck demonstratera olika korpusverktyg som används i två korpusprojekt som startats i Finland, men på grund att tekniska problem fick detta skjutas till nästa dag. Även om Elan är det dominerande verktyget, så finns det andra datorprogram som kan användas, exempelvis iLex som är vanligt i tysktalande länder. Trova och Annex gör det möjligt att använda data från Elan och visa innehållet i en webbläsare. Det är inte nödvändigt att tanka hem alla filer till den egna dator, vilket tillåter en smidigare hantering. Videofiler tar mycket plats på hårddisken, och det är inte alltid det finns tillräckligt ledigt utrymme.
Diskussioner om teckenspråkskorpusar
Under fredagsförmiddagen fördes diskussioner utifrån förberedda frågor, men det fanns också utrymme åt spontana frågeställningar. Moderator var Lars Wallin, Stockholms universitet.
En fråga rörde vilka gemensamma drag har de nordiska språken och hur ser släktskapen ut? Parallellkorpusar kan användas till sådana studier, men då är det viktigt att enas om vilka texter som ska ingå och enas om gemensamma transkriberingskonventioner.
En del frågor handlade om tekniska aspekter. Vilket är den optimala storleken för ett korpus? Ska man separera taggning för teckenformen och tecknets innehåll? Detta är kniviga frågor eftersom taggingen sker på ett annat språk, och där betydelsen hos det skrivna ordet påverkar vår uppfattning av teckenbetydelsen. Att kunna göra sökningar direkt på teckenspråk står högt upp på mångas önskelista. Men det lär dröja innan det finns teknik som gör detta möjligt.
Flera deltagare berättade att man får en mer mångfacetterad bild av teckenspråken genom att studera korpusar. Tecknen används på ett sätt som man inte har trott tidigare, och många gånger har de en mer varierad betydelse än det står i teckenordböcker.
Alla var eniga om att återkommande korpusseminarier behövs för att stärka det nordiska samarbetet kring teckenspråken. Ansvaret för att nästa korpusseminarium genomförs föll på Stockholms universitet och Språkrådet i Sverige. Det innebär inte nödvändigtvis att seminariet måste hållas i Sverige. Jyväskylä universitet flaggade för att de eventuellt kan arrangera nästa möte.
Uppdaterat 4 april: Jyväskylä universitet har tagit på sig ansvaret att arrangera nästa korpusseminarium. Minnesanteckningar från korpusseminariet i Köpenhamn finns på denna sida.