För nedladdning (.xlsx): Frekvensordlista
Datamängden består av en excel-fil med de 350 vanligaste orden i svenska journalisters presentationer på Twitter. Det är samtliga ord i urvalet som förekommer tio gånger eller fler. Urvalet är en korpus om 29 288 ord i 2 543 presentationer.
Det är fritt för alla att använda datamängden. Gör något roligt! Eller något intressant! Eftersom detta är en del av en unik datamängd (och eftersom jag undervisar och handleder studenter bland annat i hur man redovisar data på ett bra sätt) gäller följande:
- Den som använder data och publicerar egna siffror ska tala om var datamängden kommer ifrån. Credda mig, helt enkelt.
- Den som gör tabeller eller grafer ska ange urvalets storlek och aktuella N-tal.
- Den som grovt misstolkar data kommer att få bakläxa.
- Den som gör en grovt missvisande eller teoretiskt inte underbyggd analys kommer att bli tillrättavisad.
Relaterat inlägg: De tio vanligaste orden när svenska journalister beskriver sig själva på Twitter – läs listan här [140728]
Inga kommentarer:
Skicka en kommentar