Kategoriarkiv: Digital litteraturvetenskap

Digitala sångtextstudier

Nå, jag återkommer redan nu med nytt inlägg om ett par artiklar jag läst under de senaste veckorna. Efter att jag gjort mitt lilla experiment med Eva Dahlgrens texter i Voyant (se tidigare inlägg!) så snubblade jag över en artikel på nätet, Michael Fell & Caroline Sporleder 2014, ”Lyrics-based Analysis and Classification of Music” (http://www.aclweb.org/anthology/C14-1059) som baserar sig på undersökning av sångtexter med digitala metoder (det var den artikeln jag nämnde i ett kort inlägg tidigare).

I mitt eget experiment var jag ju mest intresserad av användningen av personliga pronomen och hur det hänger ihop med frågan hur ”personliga” texterna är. Fell & Sporleder är i stället ute efter att visa hur musik kan klassificeras, exempelvis genrevis, med hjälp av digitala metoder. Och de riktar intresset mot drag i sångtexterna som de visar är typiska för olika musikaliska genrer, till exempel vad gäller ordanvändning, stil, semantik, sångstruktur. Lite intressant är att det primära syftet med artikeln verkar vara att bidra till utvecklingen av redskap med vilket man kan klassificera musik på nätet, alltså en mera praktisk utgångspunkt. Implikationerna för musikologisk forskning kommer i andra hand (känns kanske som en lite främmande utgångspunkt för många humanister?).

Men också personliga pronomen kommer upp, under rubriken ”Orientation”, och artikelförfattarna har fäst uppmärksamhet vid skillnader gällande hur ”egocentriska” texterna är, genom att studera t.ex. förekomsten av själv-refererande pronomen jämfört med icke-själverefererande pronomen. Det är intressant också med tanke på min egen fråga om hur pass ”jagiska” olika genrer är i jämförelse med varandra; den här artikeln tycks alltså utgå från att det finns genreskillnader på den här punkten. Däremot tar den inte upp kön som en faktor. Den fråga jag ställde var däremot om användningen av ”jag” faktiskt är vanligare i texter av kvinnliga singer songwriters jämfört med mera mansdominerade genrer, i enlighet med den vanliga uppfattningen om kvinnliga artister som mera personliga och intima (samt mindre samhällsorienterade).

Fell och Sporleder har också försökt separera sämre och bättre musik och hittat drag som verkar vara utmärkande för populära låtar i jämförelse med den musik som inte slår igenom. Också här förekommer frågan om pronomen; sånger verkar generellt sett vara (eller uppfattas som?) bättre, ju färre ”jag” (”I”) de innehåller!

Fell och Sporleder är inte ensamma om att undersöka sånglyrik med digitala metoder. Hittade bland annat mera information på CiteLab:s sidor, se http://digihum.mcgill.ca/citelab/2012/03/06/lyrics-scholarship/ (de tycks ha ett sånglyrikprojekt på gång). På denna sida fanns också adresser till ett par sidor med konferenspapers på området. Här till exempel den lista jag hittade då jag sökte på ”lyrics” på en av dem: http://dblp.uni-trier.de/search?q=lyrics och här på den andra liknande sidan: http://ieeexplore.ieee.org/search/searchresult.jsp?newsearch=true&queryText=lyrics

Via den först nämnda sidan hittade jag en annan artikel som också var intressant i förhållande till personer och personliga pronomen i sångtexter: ”Psychology of Aesthetics, Creativity, and the Arts. Tuning in to Psychological Change: Linguistic Markers of Psychological Traits and Emotions Over Time in Popular U.S. Song Lyrics”, skriven av C.Nathan DeWall, Richard S. Pond, Jr., W. Keith Campbell och Jean M. Twinge: http://www.uvm.edu/~pdodds/files/papers/others/2011/dewall2011a.pdf Utgångspunkten för den här artikeln är egentligen inte alls litteraturvetenskaplig; det handlar om att använda sångtexter som underlag för att studera psykologisk förändring i samhället, i detta fall det amerikanska, under åren 1980-2007.

Här har man bland annat studerat just ett urval personliga pronomen, framför allt första person singularis och första person pluralis. Analysen tycks visa att också sångtexterna går hand i hand med resultat man fått i undersökningar med ”self-report”; samhället blir mera individualistiskt, självcentreringen och ensamheten ökar, uttryck för positiva emotioner minskar och uttrycken för aggressivitet och antisocialitet ökar… I sångtexterna säger man allt oftare ”I” (”jag”) och allt mera sällan ”we” (”vi”), aggressiva uttryck ökar, beskrivningen av positiva emotioner minskar också i sångtexterna… Intressant är även att artikeln hänvisar till andra studier där man i stället jämfört mera kollektivistiska kulturer med individualistiska (västerländska) kulturer och visat på motsvarande skillnader när det gäller bruk av personliga pronomen (i individualistiska kulturer förekommer ”jag” oftare i sångtexter och andra kulturprodukter etc.).

Både tidsutvecklingen och kulturskillnaderna är jätteintressanta. Visst kan man problematisera en koppling mellan användningen av ”jag” eller ”vi” i sångtexter och individualism respektive kollektivism i kulturen eller samhället. Men samtidigt är det ju ett intressant fenomen i sig att det faktiskt finns sådana här mätbara skillnader. Någonting måste det ändå säga om kulturen och samhället, frågan är i så fall snarast VAD det säger och hur resultatet ska tolkas. Den frågan kan man diskutera. Också i denna artikel noteras att det kan finnas genremässiga skillnader vad gäller bruk av pronomen (men inte heller här diskuteras det i ett könsperspektiv).

Ett par saker funderar jag över i artikeln. Författarna argumenterar för att de inte undersökt uttryck i tredje person, men däremot verkar de inte fästa uppmärksamhet vid texternas ”du”(?) Det borde väl vara intressant i sammanhanget? Om jaget ställs i relation till ett du (vilket man kunde misstänka då det handlar om populära låttexter) kanske det inte är fullt SÅ individualistiskt? Eller också kan man tolka det som att jag-du-relationen egentligen inte alls innebär så mycket mindre individualism utan snarare är en mycket liten utvidgning av jaget, som fortfarande är slutet mot resten av världen…?

Sen kan man också fundera över den automatiska koppling som artikelförfattarna gör mellan studier som visar att narcissistiska personer (både barn och vuxna) oftare säger ”jag” och användningen av ”jag” i sångtexter. Ett sångtextjag är ju ändå inte precis samma sak som ett verkligt jag. En låtskrivare skriver ”jag” i en låttext som kanske framförs och sjungs av en annan person. Och det jaget refererar ju inte direkt eller okomplicerat till låtskrivaren/sångaren/en verklig, identifierbar person. Men förstås kan ett rikligt bruk av ordet ”jag” ändå vittna om ett jagiskt perspektiv som präglar hela kulturen.

Här finns alltså frågor att fundera vidare på! En grundläggande fråga är förstås också hur man sammanställer eller får tag på ett tillräckligt stort och användbart material av (till exempel svenska) digitaliserade sångtexter, om jag alltså skulle gå vidare på idén med personer och pronomen i sångtexter.

Annons

Hej igen – och nytt på nätet

Påmindes igen om min blogg för ett par dagar sedan då min kollega råkade snubbla in på den när hon sökte på ”litteraturvetenskap” och ”konferenser” – inte den allra viktigaste sökträffen kanske men det var ju roligt att höra i alla fall! Har inte bloggat på ett tag, efter att kursen i Digital humaniora avslutades och jag därefter hade en ganska hektisk period på jobbet (då jag bland annat disputerade).

Men tänkte att jag kanske ändå kan fortsätta så smått med att dokumentera min lärprocess vad gäller digital humaniora, om inte annat för att ha ett slags arkiv att gå tillbaka till senare (har inte gjort ordentligt reklam för bloggen så lockar inte så många nya läsare precis). Kan vara bra att fortsätta skriva ändå menar jag. Har bland annat läst några artiklar på området och ska snart återkomma om det! Deltog också i ett Open Science-evenemang organiserat av kollegiet vid Helsingfors universitet nyligen (en rad intressanta exempel på vad man kan få ut av att öppna sitt forskningsprojekt på nätet).

Ska också nämna att i mitten av januari öppnades det finländska Klassikerbiblioteket på nätet (det projekt jag jobbar för), med en samling finländsk (både finsk- och svenskspråkig) litteratur, samt en del annat material: http://kirjallisuuspankki-kktest.lib.helsinki.fi/vufind/?lng=sv Samlingen ska fortsätta växa och gränssnittet är fortfarande lite under utveckling, men det är nu öppet för användare, så man kan redan hitta och läsa litteratur, samt få en överblick över forskningslitteratur kring en del författarskap.

En nyhet är också min avhandling (om Eva Dahlgrens rocktexter och artistskap). Den tillhör väl egentligen inte fältet Digital humaniora. Eller kanske den gör det lite grann i alla fall eftersom den också finns publicerad på nätet! Avhandlingen kan laddas ner på adressen https://helda.helsinki.fi/handle/10138/153033

Nordisk kvinnolitteraturhistoria på nätet – några tankar

I den andra kursuppgiften bestämde jag mig för att utvärdera och diskutera en nätresurs som gäller litteratur, nämligen Nordisk kvinnolitteraturhistoria på nätet, som finns på adressen http://nordicwomensliterature.net/sv Sajten bygger vidare på det tryckta verket Nordisk kvinnolitteraturhistoria som utkom i fem band åren 1993-1998 med Elisabeth Møller Jensen som huvudredaktör. Syftet med verket är i korthet att ge ett kvinnoperspektiv på litteraturhistorien i en nordisk kontext, med utgångspunkt i de kvinnliga författarskapen, snarare än i en föreställning om en kvinnlig litterär tradition. Hela verket digitaliserades år 2012 i ett samarbete mellan KVINFO – Videnscenter for køn, ligestilling og etnicitet, och KvinnSam – Nationellt bibliotek för genusforskning. Sajten finns i en svensk, dansk och engelsk version, även om alla artiklar åtminstone inte verkar finnas på engelska.

En klar fördel med en litteraturhistoria i digital form är att verket åtminstone i princip kan växa hur mycket som helst. I Nordisk kvinnolitteraturhistoria kan man t.ex. nu komplettera de artiklar som skrivits för det tryckta verket med nya artiklar om 2000-talets kvinnolitteratur. En annan fördel är givetvis tillgängligheten för de forskare, lärare, studenter… runtom i världen som intresserar sig för nordisk litteratur och kvinnolitteratur och som i vissa fall kan ha svårt att få tag i det tryckta verket.

Om jag tolkar informationen på sidorna rätt är de tidigare publicerade texterna i stort sett de samma som publicerats i det tryckta verket (jag upptäcker ändå att åtminstone en del författarpresentationer har uppdaterats av redaktionen). I princip innebär nätupplagan en möjlighet att uppdatera och komplettera också materialet om äldre litteratur, men av informationen på sajten framgår det inte direkt vilka framtidsplaner som finns. Det står dock att vidareutvecklingen av projektet med nya artiklar ska pågå fram till 2016. Frågan är alltså om sajten sedan är ”färdig” eller om den ska fortsätta att leva och utvecklas ännu efter detta.

Som det framkommer i informationen har den teoretiska utvecklingen gått framåt sedan 1990-talet och de nya artiklarna beaktar perspektiv som man inte var lika medveten om då den tryckta upplagan utkom. Med andra ord är det antagligen ofrånkomligt att en del av materialet i något skede kommer att kännas föråldrat vilket i sig visserligen gäller också för en bok. I nätupplagan finns förstås möjligheten att uppdatera och t.o.m. vid behov plocka bort texter som inte mera känns tillräckligt ”up to date” och ersätta dem med nyskrivet material. I nätupplagan är själva upplägget också annorlunda (t.ex. står artiklarna mera självständiga i förhållande till bokens kapitel och band, vilket gör det lättare att uppdatera och förnya om man vill).

Om man vill utnyttja de möjligheter till uppdatering som det digitala formatet (åtminstone i bästa fall) kan medföra blir en viktig och kritisk fråga den grundsyn som ligger under projektet. I det tryckta verket är det av naturliga skäl mera enhetligt och samlat, medan det i nätupplagan (åtminstone i framtiden) kan bli svårt för läsaren att bedöma hur pass aktuella och tillförlitliga de enskilda artiklarna är (betraktade som källor) om inte hela materialet uppdateras genomgående och tillräckligt ofta.

Jag tycker bra om sajtens yttre grafiska formgivning. Den ser stilig och enkel, men samtidigt modern ut, och utnyttjar den möjlighet till ”liv och rörelse” som finns på nätet, men utan att det känns oroligt. Det dyker fram förslag på intressanta teman, inklusive snyggt bildmaterial. Den intresserade kan alltså klicka fram mera information och läsa vidare. Med tanke på återkommande besökare på sidorna vore det förstås viktigt att tillräckligt ofta byta ut temaförslagen och lägga till nytt material på den första sidan, för att inte förlora effekten av att väcka nyfikenhet och locka in användaren i spännande artiklar. Också när man går vidare till andra sidor dyker det upp rutor med intressanta temaförslag och rubriker. Upplägget på huvudsidan är också tillräckligt överskådligt och materialet finns samlat under tre olika rubriker: Artiklar, Författare, Teman. Det som dock är en ofrånkomlig nackdel med det digitala formatet (åtminstone ur en traditionell bokläsares perspektiv) är att material på nätet (ändå) alltid är svårare att få överblick över som helhet, särskilt om det finns många rubrikkategorier och ingångar. Det verkar vara svårt att balansera mellan användarvänlighet och enkelhet å en sidan, samt riklighet, liv och mångsidighet å andra sidan. Risken är t.ex., ur användarperspektiv, att man lockas på ”villospår” av intressanta temaförslag och s.a.s tappar tråden samt glömmer vad man egentligen var ute efter när man gick in på sidan.

Under Artiklar finns alla artiklar samlade. Under Författare finns korta författarpresentationer samt länkar till relevanta artiklar på sajten och även till författarens verk i fulltext på andra sajter. Med andra ord kan användaren åtminstone i vissa fall gå vidare och läsa även de litterära verken. Under Teman finns ett mera begränsat antal artiklar samlade under temarubriker som t.ex. Moderskap, Sexualitet och Storstaden. Under Artiklar och Författare finns ett sökfilter som användaren kan utnyttja för att söka efter material som gäller exempelvis ett visst nordiskt land och/eller en viss tidsperiod. Materialet är alltså taggat utifrån t.ex. författarnamn, tidsperiod, land och centrala nyckelord. Den här möjligheten att leta fram material kring just det man själv är intresserad av och behöver, är också en klar fördel jämfört med en litteraturhistoria i bokform. Under författare finns även ett register över författarnamn i alfabetisk ordning, vilket också ökar användarvänligheten och överskådligheten.

Artiklarna ska i princip även kunna laddas ner i olika versioner, i en utskriftsvänlig version och pdf, men av någon anledning lyckas jag inte med att ladda ner pdf-versionerna. Det framgår av beskrivningen på sidorna att åtminstone en del av material skannats in, ocr-lästs och korrekturlästs. Texterna verkar nu vara av god kvalitet åtminstone såtillvida att jag utan problem lyckas kopiera och klistra in några av dem i en word-fil utan att upptäcka några ocr-fel. Möjligheten att kopiera vidare och skriva ut texterna ökar också användarvänligheten. Det finns också en möjlighet att registrera sig, skapa en användarprofil och ett lösen vilket öppnar ytterligare möjligheter att spara artiklar inklusive egna anteckningar i dem.

På sidorna finns också en del andra möjligheter, att t.ex. klicka fram tilläggskommentarer och hoppa direkt till en underrubrik i artiklarna. En rolig idé är också Tips från läsarna, där användarna kan lägga in egna idéer för vad man t.ex. kan göra med materialet eller vad som är speciellt intressant. Dock verkar just den här möjligheten inte användas speciellt mycket, eller åtminstone lyckas jag själv bara klicka fram en enda läsarkommentar. Frågan är om någon annan typ av interaktivitet skulle fungera bättre, t.ex. en blogg med kommentarsmöjlighet. Ur användarperspektiv är det säkert en fördel om man får en känsla av att det finns verkliga och aktiva personer bakom sidorna, och att man har möjlighet att skicka kommentarer och upprätthålla en dialog med dessa.

Det finns också ett allmänt sökfält som gäller hela sajten, där användaren kan skriva in sökord och få fram material. Tyvärr är sökordet inte markerat inne i de texter man får fram, så om inte hela texten klart handlar om det man är intresserad av är det svårt att få en snabb överblick över vad som skrivits om ämnet i materialet på sajten.

Infotexterna på sidan är i huvudsak lättlästa och relativt koncisa, och jag lyckas hitta det mesta av den information jag behöver. Den översiktliga text som beskriver projektet är dock lite rörig, och jag är inte alltid säker på vilka kommentarer som gäller den digitala utgåvan som helhet, den tryckta upplagan respektive de nya artiklar som publiceras nu eller i den närmaste framtiden. En fråga som jag gärna skulle ha läst mera om är hur redaktörerna ser på syftet med att digitalisera och de framtidsvisioner som projektet har.

Innehållsmässigt är det förstås svårt att bedöma ett så pass digert verk utan att verkligen läsa åtminstone huvuddelen av alla de texter som finns på sidorna. Åtminstone kan man säga att artiklarna förefaller vara skrivna av skrivbegåvade personer med gedigen kunskap på området. De artiklar jag stöter på under min upptäcksfärd på sidorna är också välskrivna och intressanta och, med tanke på att det handlar om en litteraturhistoria, håller de också en bra balans mellan den sammanfattande faktainformationen och det intresseväckande flytet i texten.

Snabbt inlägg mitt i allt

Sitter egentligen och går igenom litteraturförteckningen i min avhandling… och mitt i det arbetet snubblar jag av en händelse över en artikel, apropå min senaste kursuppgift (föregående inlägg) om rocktexter:

http://www.aclweb.org/anthology/C14-1059

Tyvärr hinner jag inte läsa den nu då avhandlingsmanuset tycks sluka det mesta av min tid, men måste återkomma till detta. Tydligen finns det alltså redan några som undersökt rocktexter med digitala metoder!

Spännande! Men nu tillbaka till att fundera på om kommatecken ska stå före eller efter årtal, om man ska ha med konstiga nummerserier som vissa tidskrifter tycks gilla och andra lika fascinerande frågor…

Hur personlig är Eva Dahlgren?

Det börjar dra ihop sig, till jul och för min del (om ett par månader) också till disputation. Vilket betyder att det inte blivit så mycket tid för bloggande de senaste dagarna, tyvärr. Men här kommer i alla fall min första kursuppgift. Beklagar att en av bilderna är lite otydlig (hade lite problem då det inte gick att spara bilderna på min egen och universitetets datorer, och hinner inte nu springa tillbaka till lånedator för att göra en bättre bild!).

Några observationer utifrån ett digitalt experiment med Eva Dahlgrens rocktexter

I den första kursuppgiften har jag valt att testa ett nytt redskap, nämligen Voyant, på ett bekant material, nämligen Eva Dahlgrens rocktexter, som också utgör material i min doktorsavhandling (Biström 2015). Kan man, med hjälp av detta redskap, hitta nya perspektiv på materialet? Sätter det mina eller andras tidigare analyser av Dahlgrens texter i ett nytt ljus? Eller, är det helt poänglöst ur litteraturvetenskaplig synvinkel att studera sådana saker som ordfrekvenser i en litterär text…?

Innan jag griper an verket att klämma in Dahlgrens textproduktion i Voyant, först några ord om redskapet. Voyant Tools hittas på adressen http://voyant-tools.org/ och är en nätmiljö för textläsning och –analys. Voyant är lätt att använda; man kan kopiera in texter (i olika format) i en ruta, och få fram grundläggande information om förekomsten och användningen av olika ord i texten. Voyant visar t.ex. den totala förekomsten av ord och skapar ett så kallat ordmoln som visar vilka ord som är mest förekommande i texten. Ordfrekvensen korrelerar med ordets storlek i ordmolnet; dvs. ju större ordet är i molnet, ju oftare förekommer det i texten. Man kan också få fram ytterligare information med hjälp av olika tilläggsredskap, t.ex. se hur många gånger ett enskilt ord förekommer (genom att föra kursorn över ordet i molnet), se på en kurva hur förekomsten av ett ord varierar i olika delar av textmaterialet (t.ex. om ordet blir mindre vanligt mot slutet av texten) och studera på vilka ställen ordet förekommer i själva texten. Man kan också använda olika stoppordslistor som plockar bort vanliga, och möjligen mindre betydelsebärande ord i det aktuella språket, som t.ex. olika slags pronomen etc. (Se vidare Voyant Tools Documentation http://docs.voyant-tools.org/start/ )

Sedan några ord om materialurval. I det här lilla experimentet valde jag att utgå från de av Eva Dahlgrens musiktexter som uppfyller följande kriterier:

  • De är från perioden 1978-2000, i stort sett samma period som materialet i min avhandling (1980-2000) med den skillnaden att jag här också tog med Dahlgrens första skiva Finns det nån som bryr sig om från 1978 (jag tog också med texterna på hennes konstmusikaliska skiva, Jag vill se min älskade komma från det vilda, 1995, vars texter jag inte analyserar i avhandlingen). Jag valde däremot bort texter på Dahlgrens samlingsskivor under perioden, helt enkelt för att de innehåller texter som redan förekommer på de andra skivorna.
  • De är skrivna på svenska (vilket jag tyckte var lämpligt med tanke på jämförbarheten). Det innebär att ett antal engelska texter från framför allt den tidiga produktionen utelämnades.
  • De finns på Eva Dahlgrens hemsida evadahlgren.com , detta av praktiska skäl, då de måste finnas i elektronisk form för att kunna studeras i Voyant. De flesta texter som uppfyller de övriga kriterierna finns på hemsidan, men några enstaka texter uteblev ur studien för att de saknades där.

Mina urvalsprinciper innebär att jag i det här lilla experimentet, intressant nog, valde ett större material än det urval jag analyserar mera ingående i min (betydligt mera omfångsrika) avhandling. Detta verkar lämpligt med tanke på den kvantitativa aspekten av metoden (även om Dahlgrens textproduktion i sig kanske inte är stor nog för att kunna rubriceras ”big data”!).

Av praktiska skäl valde jag att utgå från en skriftlig variant av texterna (texterna i den form de står på Dahlgrens hemsida). I min avhandling har jag däremot själv transkriberat och analyserat den framförda varianten av ett urval texter på cd-skiva, eftersom publiken i första hand möter rocktexten i sjungen form (se vidare om musiktextens olika varianter, t.ex. Strand 2003: 71-72, Bowden 1982: 2 och Svedjedal 2004: 24-26). Den här skillnaden är inte betydelselös, inte heller vad gäller ordfrekvenser. I skriftliga varianter av rocktexterna är det vanliga att t.ex. upprepningar av refrängen utelämnas eller förkortas. Eftersom refrängen ofta upprepas några gånger i (den framförda) texten, och ibland också förekommer i början och/eller slutet av texten som ett s.k. intro eller outro, ger de skriftliga versionerna inte en helt korrekt bild av förekomsten av de ord som upprepas i refrängen. Dessutom byggs refrängerna ofta upp av en s.k. hakefras som upprepas flera gånger. Ett belysande exempel är att ordet ”jag” (som ni snart kommer att se att är centralt i denna studie) förekommer 43 gånger i den sjungna varianten av Dahlgrens kända låt ”Jag klär av mej naken” (1987), vilket är mångdubbelt mera än i de olika skriftliga varianterna. Att transkribera alla de texter jag ville undersöka här enligt framförandet skulle vara ett större projekt, så jag hoppas att de skriftliga varianterna ändå ger en anvisning om vilka ord som är vanligast i Dahlgrens texter.

Ännu lite (lätt) teori: Om man ser till det växande forskningsfältet Digital humaniora, kan man säga att Voyant och den slags studie jag gör här, till viss del svarar mot konstaterandet att bokens och den lineära textens hegemoni är över, också i t.ex. presentationen av forskningsresultat. Man talar exempelvis om nya typer av interaktiva visualiseringar (se t.ex. Clement, Sinclair et.al. och Parland von Essen & Nyberg), av den typ användaren av Voyant kan skapa med valfritt material, t.ex. ordmoln. I likhet med Jessica Parland-von Essen och Kenneth Nyberg tycker jag det är viktigt att ändå poängtera att den insikt man kan få med hjälp av visualiseringar inte i sig är ”färdig kunskap” utan behöver processas.

På samma spår är Tanya Clement (s. 142) i sin artikel ”Text Analysis, Data Mining and Visualizations in Literary Scholarship”, som i speciellt hög grad var en inspiration och igångsättare för den här uppsatsen. Artikeln väckte lusten att prova en liknande metod som hon använder, men på mitt eget material. Clement (s.139) använder Marjorie Perloffs begrepp ”differential reading” och utgår från uppfattningen att en kombination av olika närläsnings- och fjärrläsningsmetoder (close reading och distant reading) kan bidra till tolkningen av den litterära texten. Utifrån en sådan syn känns det intressant att diskutera vad observationer av ordfrekvens och -användning kan tillföra de läsningar av Dahlgrens texter jag gör i min avhandling. Som David L. Hoover (s. 42) påpekar är just ordanvändningen också en praktisk utgångspunkt för en studie på så sätt att ordet i sig redan är meningsbärande och på olika sätt kan kopplas till andra betydelsenivåer, t.ex. tematik och ideologi.

När jag matat in Dahlgrens texter i Voyant fick jag följande ordmoln som resultat:

ordmoln-alla dahlgrens texter

Jag provade också att använda en stoppordslista men det resultat jag fick då väckte åtminstone inga omedelbara tankar. Det som väckte mitt intresse i mitt ursprungliga moln (ovan) var däremot de personliga pronomina. Jag valde därför att utgå från detta moln, eftersom just personliga pronomen hörde till de ord som försvann i det redigerade molnet. Det här valet belyser att påstått ’betydelselösa’ ord inte nödvändigtvis är ointressanta för analys av texten och att avlägsnandet av stoppord, som även t.ex. Bei Yu (2008: 341) påpekat, inte ska göras utan noggrant övervägande.

Det vanligaste ordet i texterna är alltså ”jag”. Också andra ord som hänvisar till jaget är vanliga: ”mig”, ”min”, ”mitt”, ”mina”. Även ”du” tillhör de vanligaste orden; ”dig” och ”din” förekommer likaså i molnet. Andra ord som hänvisar till personer är t.ex. ”hon”, ”dom” och ”vi”.

Att ”jag” är det vanligaste ordet, och att även ett ”du” mycket ofta förekommer i Dahlgrens texter, tycks bekräfta flera etablerade uppfattningar om såväl Eva Dahlgren och hennes genre, som rocktexter överlag. Min egen avhandling fokuserar på hur bilder av ett autentiskt ”jag” och en autentisk ”Eva Dahlgren” skapas i rocktexterna, och ordmolnet tyder på att många av Dahlgrens texter faktiskt utgår från ett jagperspektiv. Forskningen har också hävdat att ett ”jag” som talar till ett ”du” typiskt förekommer i rocktexter överlag (Lindberg 1995: 64, se även Negus 2011: 617). Tero Julkunen (1996: 36, 89-90) bekräftar i den kvantitativa delen av sin språkvetenskapliga avhandling pro gradu att Dahlgrens texter är typiska för sin genre. Han visar nämligen att ”jag” är vanligast som subjekt i huvudsatser, och att jag-du är den viktigaste referensrelationen (alltså ett jag talar till ett du) i de sångtexter som ingår i hans material.

Ordmolnet tycks också stöda en vanlig uppfattning bland t.ex. rockjournalister, att det personliga, självutlämnande och intima är centralt i Dahlgrens musik och texter, att texterna är ett slags ’offentlig dagbok’ eller terapi för artisten (se vidare Biström 2015, t.ex. avsnitt 3.6.1). Inte minst stöder det uppfattningen om Dahlgren som en typisk representant för den personliga och ofta kvinnliga singer-songwritertradition som även Hillevi Ganetz (1997: 138) sätter henne i förbindelse med. I denna tradition beskrivs personliga, autentiska känslor och erfarenheter som ett viktigt fundament. I förhållande till rockens autenticitetsideal, som är centralt i min avhandling, framstår Dahlgren därför som en typisk representant för det som Johan Fornäs (1994:168-169) benämner subjektiv autenticitet. Det innebär en konstruerad äkthet baserad på det personliga och på relationen mellan jaget och duet, i kontrast till exempelvis social autenticitet, som snarare utgår från det kollektiva och t.ex. kan vara mera politiskt orienterad.

På någon punkt kan ordmolnet också användas till att ifrågasätta ett omdöme om Dahlgren. Peter Nynäs (1997: 127-132) beskriver t.ex. en vändpunkt i Dahlgrens något senare produktion. Han menar att textens ”du” tar den plats som ”jaget” tidigare haft, och att Dahlgrens texter öppnar upp för identifikation, parallellt med att de öppnar för en ny andlighet. I min avhandling har jag delvis ifrågasatt detta genom att hävda att en möjlighet till identifikation funnits också i tidigare rocktexter (trots deras mera avståndstagande tilltal), och vidhållit att jaget fortsatt är av helt central betydelse i de senare texterna, inte minst som ett grundläggande villkor för mötet och identifikationen mellan jaget och duet (se vidare Biström 2015, avsnitt 5.2.2.1).

För att möjligen få svar på frågan om förskjutningen mellan jagets och duets position, kan man se på de kurvor i Voyant som visar den tidsmässiga växlingen mellan frekvensen av orden ”jag” och ”du” i sångtexterna, först ordet jag:

ORDET JAGchart00WU53GQ

Sedan ordet du:

ORDET DUchartQ00KD4MU

Den första kurvan tycks i viss mån stöda Nynäs tolkning då förekomsten av ordet ”jag” minskar något med tiden. Men samtidigt minskar också användningen av ordet ”du” (som vi ser i den andra kurvan) rentav mera dramatiskt mot den senare produktionen. Kurvorna visar också att ”jag” genomgående är ett vanligare ord än ”du” i Dahlgrens rocktexter.

Men gör Voyant då ingenting annat än bekräftar det som många redan tycks ”veta”, att Dahlgren är en typiskt kvinnlig singer-songwriter vars texter utgår från jaget, och kretsar kring (framför allt jag/du)-relationer? Trots allt har ju forskningen (även min egen avhandling) försökt nyansera och problematisera denna bild av Dahlgren, och av kvinnliga artister, liksom av rocktexter överlag. Till exempel har den feministiska populärmusikforskningen problematiserat synen på kvinnliga artisters texter som begränsat personliga och subjektiva (se t.ex. Mélisse Lafrance, i Burns & Lafrance 2002: 63-65).

Här kan man för det första påpeka den minskade användningen av både ”jag” och ”du” över tid som kurvorna ovan visade. Kanske tyder de på att ett mindre jagiskt och mindre relationsorienterat perspektiv så småningom tar över i Dahlgrens texter? Detta kunde ses som parallellt med en del rockjournalisters bedömning om en mognare, och tidvis en mera politisk Dahlgren från slutet av 1980-talet (se vidare Biström 2015, avsnitt 3.4.1 och 3.6.2).

För det andra måste man påminna om vad metoden gör, och vad den inte gör. Voyant hjälper oss att, på bara några sekunder, räkna de olika ord som förekommer i ett textmaterial. Men det ger oss ingen självklar tolkning av vad resultatet betyder. Den rikliga förekomsten av ord som ”jag” och ”du” bevisar inte i sig att texterna är begränsat personliga, opolitiska etc. Ett personligt perspektiv utesluter inte t.ex. mera allmängiltiga teman eller politiska budskap.

Dessutom kan man ställa frågan vilket resultat man skulle få ifall man, i jämförande syfte, matade in texter också av andra kvinnliga singer-songwriters och av t.ex. manliga artister och musikgrupper. Hoover (s. 39, 47-52) tar som exempel upp möjligheten att jämföra olika författares språkbruk t.ex. utifrån genus och gör själv en jämförelse av hur manliga och kvinnliga poeter använder ord (även om hans utgångspunkt inte är just ordfrekvens). Kanske en liknande undersökning kunde göras med rocktexter: Hur många ”jag”, ”du” eller ”vi” skulle man hitta t.ex. i sådana texter som har rykte om sig att vara ”kollektiva”, politiskt ställningstagande och som motsvarar Fornäs (1994:168-169) beskrivning av social autenticitet? Säger en manlig hip hop-grupp ”vi” oftare än den kvinnliga singer-songwritern…osv.?

Detta belyser att de nya redskap som digital teknik förser oss med inte bara innebär att vi kan få fram nya slags resultat, utan som Tanya Clement (s. 139) påpekar, att vi kan hitta nya ingångar, ställa nya forskningsfrågor och hypoteser (se även Hoover, s. 38-39). Vi kan få syn på ett intressant spår och följa det, samt fördjupa diskussionen kring detta, bekräfta eller ifrågasätta befintlig forskning och etablerade föreställningar. Clement (s. 141) påpekar också möjligheten att hitta drag som är särskilt utmärkande för en viss text genom att jämföra den med andra texter och på så sätt vaska fram de drag i texten som gör den speciell och avvikande.

Kanske borde jag gå vidare och göra just detta, för att få mera kunskap och nya synvinklar på t.ex. påståendet om det personliga i kvinnliga rocktexter? Det här lilla experimentet resulterade kanske inte i några nya och revolutionerande insikter om Dahlgrens texter. Men den gav alltså idéer för hur man kunde gå vidare och vilka frågor man kunde ställa till ett större och mera varierat material.

Källor:

Biström, Anna 2015: Att göra äkthet. Skapandet av ”Eva Dahlgren” i pressens rockjournalistik och i Dahlgrens rocktexter åren 1980-2000 [utges i februari 2015], Helsingfors universitet, Helsingfors.

Bowden, Betsy 1982: Performed Literature. Words and Music by Bob Dylan, Indiana University Press, Bloomington.

Burns, Lori & Lafrance, Mélisse 2002: Disruptive Divas. Feminism, Identity & Popular Music, Routledge, New York/London.

Clement, Tanya, “Text Analysis, Data Mining and Visualizations in Literary Scholarship”, Price, Kenneth M. & Siemens, Ray, Literary Studies in the Digital Age. An Evolving Anthology, http://dlsanthology.commons.mla.org/text-analysis-data-mining-and-visualizations-in-literary-scholarship/

Eva Dahlgrens hemsida, www.evadahlgren.com

Fornäs, Johan 1994: ”Listen to your voice! Authenticity and reflexivity in rock, rap and techno music”, New Formations 24, s. 155-173.

Ganetz, Hillevi 1997: Hennes röster. Rocktexter av Turid Lundqvist, Eva Dahlgren och Kajsa Grytt. Brutus Östlings Bokförlag Symposium, Stockholm / Stehag.

Hoover, David L., ”Textual Analysis”, Price, Kenneth M. & Siemens, Ray, Literary Studies in the Digital Age. An Evolving Anthology, http://dlsanthology.commons.mla.org/textual-analysis/

Julkunen, Tero 1996: ’Jag’ och ’du’ i Eva Dahlgrens sångtexter, avhandling pro gradu i nordisk filologi, Åbo universitet [opublicerad].

Lindberg, Ulf 1995: Rockens text – Ord, musik och mening, Brutus Östlings Bokförlag Symposium, Stockholm/Stehag.

Negus, Keith 2011: ”Authorship and the Popular Song”, Music and Letters, Vol. 92, Nr. 4, Oxford University Presss. 607-629.

Nynäs, Peter 1997: ”Om jag skriver en sång. Eva Dahlgren från verklighet till identifikation”, Finsk Tidskrift 2-3, s. 123-132.

Parland von Essen, Jessica & Nyberg, Kenneth, Historia i en digital värld, ”Visualiseringar”, http://digihist.se/5-metoder-inom-digital-historia/visualiseringar/

Sinclair, Stéfan; Ruecker, Stan och Radzikowska, Milena: ”Information Visualization for Humanities Scholars”, Price, Kenneth M. & Siemens, Ray, Literary Studies in the Digital Age. An Evolving Anthology, http://dlsanthology.commons.mla.org/information-visualization-for-humanities-scholars/

Strand, Karin 2003: Känsliga bitar. Text- och kontextstudier i sentimental populärsång. Ord & visor, Skellefteå.

Svedjedal, Johan 2004: ”Röstens litteratur. Bob Dylans betydelser”, Tänkta världar. Två essäsamlingar i en volym, Wahlström & Widstrand, Stockholm, s. 109-147.

Voyant Tools, http://voyant-tools.org/

Voyant Tools Documentation, http://docs.voyant-tools.org/start/

Yu, Bei 2008: “An evaluation of text classification methods for literary study”, Literary and Linguistic Computing, Vol. 23, No. 3, s. 327-343, http://llc.oxfordjournals.org/content/23/3/327.full.pdf+html

Big Data Approaches och Helsinki Digital Humanities Day

I början av denna vecka har vi haft några medvetendehöjande dagar här hemma i Helsingfors (alltså evenemang kring digital humaniora). Dels ordnades symposiet Big Data Approaches to Intellectual and Linguistic History den 1-2.12. http://www.helsinki.fi/collegium/events/big-data/index.html , dels Helsinki Digital Humanities Day idag den 3.12. http://www.helsinki.fi/collegium/events/hdhd/index.html

Har deltagit i delar av programmet, och för det första var det roligt att upptäcka att en del begrepp nu (efter att jag utbildat mig lite på kurs) plötsligt fått ett mera konkret innehåll. Jag sitter inte mera som ett fullständigt frågetecken då föredragshållaren slänger omkring sig begrepp som ”Topic Modeling” eller ”Google Ngram”!

En utgångspunkt för evenemangen verkade vara en önskan att stödja dialogen mellan digital humaniora och humaniora i stort och undvika onödig splittring inom fältet, att de som nu verkar vara ”cutting edge” ska undvika att ”cutting themselves off” som det uttrycktes i inledningen till det först nämnda symposiet. Det tycker jag är en bra utgångspunkt, trots att jag förstår att det också kan vara nödvändigt att positionera sig som forskare och att friktionsfria kombinationer kanske inte alltid är möjliga.

En litteraturvetenskaplig höjdpunkt på symposiet var då Jonathan Hope (från University of Strathclyde) demonstrerade hur digitala metoder kan bidra till att skapa en ny litteraturhistoria. Han beskrev hur digitala metoder, ironiskt nog, inte nödvändigtvis innebär att vi gör samma saker som vi gjort förut, fast ”longer, stronger, bigger”. Utan det kan också innebära att vi landar i en ny litteraturhistoria som förefaller vara ”duller, smoother, more average”. I undersökningar av ett urval språkdrag i en ”Early Modern Drama”-korpus framstår t.ex. Shakespeare inte som ett unikt geni som radikalt förändrar dramatiken i sin tid, utan tvärtom som mainstream i allra högsta grad.

(Mera material om detta: http://winedarksea.org/ och http://earlyprint.wustl.edu/ )

Förstås kan man problematisera det här: Hur mycket påverkar t.ex. kombinationen av språkdrag (som självklart i sig innebär ett moment av tolkning) det resultat man får? Hope medgav själv villigt att den lilla punkten på den graf han visade upp ju egentligen inte ÄR Hamlet… Litteraturen har flera nivåer och alla kan inte fångas in av en metod (vare sig digital eller traditionell). Man kan också fråga sig om alla icke-digitala humanister verkligen ser på litteraturhistorien som en parad av unika och radikalt avvikande genier. Har inte t.ex. den feministiska litteraturforskningen och kanonkritiken redan nyanserat en sådan bild? (fast det är ju möjligt att sådana föreställningar ofta lever kvar i forskningspraktiken, även om teorin redan ifrågasatt dem).

Ett annat intressant inlägg, under Helsinki Digital Humanities Day, hölls av Caroline Bassett (från University of Sussex) som på ett reflekterande sätt kretsade kring frågan vad digital humaniora egentligen är. Hon påpekade bl.a. att utvecklingen i digital humaniora för tillfället styrs främst av krafter utanför det akademiska, inte minst av den digitala utvecklingen i sig (som är en förändring i samhället som helhet). Och att vi inte mera är lika exalterade av de nya möjligheter som den digitala teknisken medför, utan digitaliseringen har blivit en del av den gråa vardagen. Det förändrar också vårt perspektiv, menade hon. En viktig poäng i hennes inlägg (som även andra framhållit) var att digital humaniora ännu inte är något statiskt eller etablerat fält, utan att de som nu bidrar till forskningen på området har möjlighet att vara med och påverka vad begreppet ska betyda. I inlägget väcktes även frågan om digital humaniora i framtiden kommer att vara ETT forskningsområde, eller om de olika formerna av digital humaniora som finns idag kommer att bilda sina egna discipliner och tvinga oss att rita om kartan.

Bassett berörde också något som varit en viktig insikt för mig. När jag först kom i kontakt med digitala metoder tänkte jag spontant att de här perspektiven och metoderna knappast kan vara till nytta i litteraturforskningen, med tanke på att litteraturvetare oftast intresserar sig för nyanserna i t.ex. enskilda texter och gör kvalitativ forskning. Vad jag INTE kom att tänka på lika snabbt är att litteraturforskning i framtiden kanske kan vara något (delvis) annat än det är idag. Utvecklingen bygger inte bara på harmonisk kontinuitet, utan också på brott mot det invanda och på linjer som spretar i nya överraskande riktningar. Också Bassett talade om att digital humaniora kan innebära inte bara nya sätt att få svar på våra (gamla) frågor, utan också att vi kan börja ställa helt nya frågor till vårt material. Och att vi kan producera nya former av kunskap.

Lovsång till boken… och olika slags läsare

Är nyss hemkommen från kursworkshop i Göteborg, full av nya intryck och tankar kring digital humaniora. Förutom föreläsningar, diskussioner och övningar på kursen hann jag också ta en promenad på Lisebergs julmarknad. Och det visade sig att hotellet hade en bastu. Fick alltså även tillfälle att upplysa svenska bastubadare om finsk bastukultur och det svenska i Finland! Och det fanns t.o.m. en liten bubbelpool utomhus. Att flyta på rygg i en ångande varm pool och titta upp på den mörka novemberhimlen över Göteborg är helt ok!

Och som sagt fick jag många nya intryck vad gäller digital humaniora. Det finns inte plats och tid för att berätta om allt här just nu, så jag väljer en sak. Visst är det en intressant tanke att den tryckta bokens hegemoni har styrt vårt tänkande rätt länge, och att den digitala utvecklingen fått upp våra ögon för andra medier och sätt att presentera kunskap. Samtidigt var det roligt att t.ex. redaktörerna för den svenska Litteraturbanken http://litteraturbanken.se/#!/start, under sin inspirerande föreläsning på kursen, berättade om sin oro för just de tryckta böckernas framtid. Då de helt fysiskt är tvungna att skära upp böcker för att t.ex. kunna skanna dem, så blir de mera medvetna om bokens värde – och dess utsatthet.

Kan inte låta bli att därför uttrycka min stora kärlek till (nostalgisk suck…) den traditionella boken, dess sätt att strukturera kunskap och den koncentration den kräver. Och när jag tänker t.ex. en solig sommardag, att sitta ute på en strandklippa och läsa, så är det fortfarande en traditionell bok jag vill ha som sällskap (inte en dator, läsplatta, smarttelefon).

Utvecklingen innebär inte bara att vi frågar oss om skärmen ersätter boken, utan också om datorn ersätter oss som läsare. Själv känner jag mig inte direkt hotad. Jag tror och hoppas att det alltid kommer att finnas människor som själva vill sitta t.ex. på en strandklippa och läsa, reflektera och lära sig (i stället för att mata in texten i något datorprogram för att få fram en resultattabell och statistik om ordfrekvenser mm.). Datorn kan ju inte ge oss läsupplevelsen, även om den i vissa fall kan göra delar av analysjobbet för oss (och talar vi om att räkna, organisera etc. gör datorn t.o.m. jobbet bättre än en mänsklig läsare).

Innan kursworkshopen funderade jag över hur man använder begreppet ”close reading” (som motsats till ”distant reading”) inom digital humaniora. I mitt huvud hör ”close reading” ihop med nykritiken och dess syn på texten som självtillräcklig och relativt sluten. I texterna om digital humaniora utgår man från en bredare definition på ”close reading” och ibland känns det som om det helt enkelt betyder ”reading”, alltså mänsklig läsning. Marcus Nordlunds artikel om Shakespeare (en slags förberedelse för hans kommande bok i ämnet) som vi läste inför workshopen, samt Nordlunds föreläsning på kursen, öppnade nya perspektiv på detta. Artikeln visade t.ex. hur man kan kombinera digitala metoder med mänsklig läsning och tolkning, att taggning av ett fenomen i texten också innebär tolkning, och att en mänsklig tolkning oftast är nödvändig för att resultatet av de digitala metoderna ska bli meningsfull. Nordlund använde begreppet ”authorial habit” och menade att man med datorns hjälp kan förbigå den så kallade författarintentionen och i stället se på vad författaren faktiskt tenderar att GÖRA och vad som faktiskt händer i själva texten – en tanke som ligger väldigt nära de tankar som styr traditionell close reading. Det en dator gör är i en del avseenden faktiskt en form av ”close reading”, en läsning starkt knuten till enskildheterna i själva texten. Datorn är kanske det textanalysverktyg som en extrem form av nykritisk analys skulle förutsätta – och som vi mänskliga läsare (lyckligtvis!) aldrig kunnat bli.