Hjelp, jeg trenger hjelp fra kyndige bloggere!
La oss si at noen holder på med en masteroppgave om blogging. La oss si at denne noen skal kjøre en haug med blogger gjennom et analyseprogram. La oss også si at denne personen syns det er fryktelig kjedelig å klikke, klippe og lime seg gjennom hele arkivet til hver eneste blogg før nevnte person får puttet det inn i en tekstfil som kan behandles.
Hvis dette var tilfellet, hva kunne personen gjøre? Finnes det for eksempel en feed-leser som viser hele arkivet på en side? Helst uten bilder, for eksempel?
Svar mottas med stor takk og virtuelle bjørneklemmer utloves til bidrag som fører til en snarlig løsning.
Om noen skulle være videre interessert, kan man gå hit og laste ned "project description".
Ja takk til prosjektbeskrivelse :) Dessverre ikke i stand til å bidra med teknisk løsning.
Det finnes noen programmer som brukes i kvalitativ metode / tekstanalyse. Det du beskriver er ikke en metode for analyse av noe som helst. For tekstanalyse må du gjøre utvalg i tekstene selv basert på de kriteriene du legger til grunn for utvalget. Hver tekst/del av tekst må klippes ut og settes inn i en kontekst basert på forskningsdesignet ditt: Hva du skal undersøke. Det eneste du kan gjøre med et dataprogram der du tømmer alt inn er å analysere forekomster av tekststrenger / ord. Det kan du like gjerne gjøre i Word. Men hvis du skal analysere teksten, må du bearbeide den selv. Tove Thagaard beskriver denne metodikken/analysen i sin bok om kvalitativ analyse/metode.
Jeg skal bruke et program som heter LIWC (http://www.liwc.net/) Dette teller forekomsten av forskjellige ordkategorier. Så kan man evt. bruke SPSS på resultatene fra LIWC.
Men, som du sier, for å kunne plotte inn data må jeg hente ut teksten fra bloggene (og renske opp i skrivefeil o.l) Det jeg lurer på, er om det finnes en enklere måte å gjøre det på, enn å klikke seg gjennom arkivet og så copy/paste inn i word.
Nei. Ikke som jeg har hørt om i hvertfall. Hvis det er ordkategorier eller ord, så bryter alt med datateknologiens oppbygning der alt er ettall og nuller. Tekst har en betydning som ikke kan behandles numerisk. Du vil også havne i et validitetsproblem her hvis ikke alle ordene er riktig skrevet. Likeledes vil mange bruke feil ord for å beskrive ting. Jeg ville gått igjennom tekstene for å kvalitetssikre, og eventuelt merket meg feil. SÆRLIG hvis du skal analysere kvantitativt i etterkant. Les metode for mediafagene. Der ser du hva du kan havne opp i. Det er vel en bok av Helge Østbye m.fl som er god der. De driver jo mye med tekstanalyse. Jeg tror ikke problemet ditt er å importere tekst, men heller å kvalitetssikre betydningen av dem.
Er det alle poster fra et arkiv du skal hente, eller holder det med alle nye poster? Du kan fint bruke en RSS-fetcher for å parse informasjonen i RSS-feeden til bloggene du skal undersøke. Deretter kan du lagre nyhetene i det formatet du vil, enten om det er i en database eller i en tekstfil. Denne tar dog ikke med gamle innlegg, ettersom slike feeds gjerne er begrenset til de 10 siste postene.
Writern. Stemmer. Det er anbefalt å gå gjennom teksten med stavekontroll for å rydde opp i feil, slang og evt. forkortelser. Kvalitativ analyse kommer på et senere tidspunkt. Akkurat nå er første bøygen å hente teksten ut fra bloggene på enklest mulig måte, både med tanke på kvantitativ og kvalitativ analyse.
BZA: Jeg skal ha alt som er skrevet på hele bloggen. I noen tilfeller kan jo det bli flere år.
Hm..sånn rent teknisk kan jeg ikke hjelpe deg, men lurte på det med skrivefeil. I min tid på universitetet skulle alle skrivefeil være med med [sic] etter. Er det slutt på det?
Forøvrig: Lykke til og hadde vært morsomt å lese hva du finner ut av det!
Du skal kartlegge en personlig(hets) utvikling hos bloggeren? Finne ut hvilke personligheter som blogger om hva? Undersøke om bloggerne blir mer depressive etterhvert som det går opp for dem at ingen leser det de skriver? Fortell litt da for fanden! Dette høres jo morsomt ut, for du kan jo umulig ta for deg mer enn ti tjue blogger hvis du skal komme i mål uten en doktorgrad?
Mihoe: I det kvantitative analyseprogrammet, så vil ord telles feil om de ikke er skrevet rett. Så i det øyemed må man forandre på dem.
Writern: Jeg skal se etter historier om identitetsutvikling hos amerikanske bloggere som bor utenlands. I den kvantitative biten regner jeg med å bruke et bredt utvalg, men basert på denne, skal jeg velge ut en håndfull som jeg går i dybden på.
Spennende prosjekt!
Tonje: Høres spennende ut.
Mihoe/tonje: Hvis man registrerer feilskrevne ord i SPSS som en egen kategori tror jeg man kan si noe om hvor mye feil som blir skrevet..hehehe Men neppe så mye mer uten å stille en rekke andre forskningsspørsmål. Jeg ville utelatt dem da forskningsdesignet har identitetsutvikling som hovedformål. Klart språk er viktig her, men som medium er populærbloggen" kjapp, muntlig i sin egenart, og har tildels rom for feil fordi den er akseptert som kjapp, spontan og personlig Litt den samme problemstillinga som SMS-språk. Det ser ut for meg som Tonje er ute etter innholdet i teksten fremfor formen. Jeg ville retta opp skrivefeil. Men meningsinnholdet er vanskeligere å rette opp, hvis det er brukt uttrykk som ikke dekker det bloggeren egentlig sier gjennom helheten av teksten. Et umåtelig spennende og vanskelig prosjekt. Lykke til Tonje!
Jo takk :) Lasta forresten opp prosjektbeskrivelsen, så om det er ønsket, kan den finnes her: http://www.spaltet.net/infosider/
Dette var spennende! Regner med at du publiserer / linker til oppgaven når den er i havn....?
Jeg leste prosjektbeskrivelsen. Her har du jammen mye å forholde deg til. Dessuten er du langt inn i sosiologien, ser jeg. Morsomt! Giddens er bra men Goffmann er også relevant! Ellers lurer jeg litt på hvordan du skal håndtere permanent vs midlertidig flytting, årsak til flytting, alder vs. teknologibruk, kontaktnett vs alder / yrke. Teknologifolk flytter jo mye på seg men drar med seg det virtuelle kontaktnettet. Hva med de som har gifta seg med en norsk kvinne/mann og starter helt fra scratch? Det er jo et spenn her som ville fått en hver sosiolog/sosialpsykolog til å svette.
Skal du velge ut en bestemt kategori utflyttere, eller?
Jeg bøyer meg i støvet for ambisjonsnivået! :-)
Ha, ha det lurer jeg også på! Men det kan vel hende det blir litt klarere etterhvert. Dette er strengt tatt dag 1. Veien blir til mens man går, får man håpe.
Eventuell publisering av oppgave avhenger nok av hvor fornøyd jeg blir med karakteren.. :)
Amerikanerne flytter ikke gjerne. De reiser på "eksotisk" ferie til Europa for å oppleve ting. Teknologifolka og businessfolka flytter midlertidig for å jobbe i konsernets datterselskaper. De blogger, men beholder identiteten sin i kraft av å representere (den amerikanske) bedriftens identitet. Men hvis du hadde satt fokus på østeuropeere sin flytting til Norge, Tyskland og Frankrike hadde du fått en ganske homogen gruppe kvinner bl. annet som må utviikle sin identitet/nye kulturelle tilhørighet fra scratch. De skriver kanskje ikke blogger i særlig grad. Ellers vet jeg at svært mange som flytter fra 2. verdens land land holder kontakt med hverandre på internettforum der de skriver om sine opplevelser og situasjon. Bloggen er likeledes et problematisk medium der mange idylliserer seg selv og sin situasjon, samtidig som den er kulturelt og aldersmessig avhengig. Ikke for å blande meg oppi det der altså..heheh Men faen å! Det er jo spennende!
«BZA: Jeg skal ha alt som er skrevet på hele bloggen. I noen tilfeller kan jo det bli flere år.»
Spiller egentlig ikke så stor rolle, programvare for å plukke ned hele websites har eksistert i årevis, gjerne brukt for å lese websider offline. Tucows burde gi deg flere eksempler på slike. Siden jeg ikke vet hva slags plattform du kjører på skal jeg ikke foreslå noen spesifikke.
Evt kan `wget' (GNU-verktøy tilgjengelig for eks på Linux) gjøre samme jobben.
Hvorvidt det er enkelt å programmere seg til en fjerning av unødvendige deler av sidene vil avhenge av hvordan de er designet, et annet alternativ er å dytte dem gjennom `links' og få ren tekst ut, og så fjerne de unødvendige delene, men dette er kanskje like tungvint som å klippe&lime manuelt fra en browser.
Følgende kommandolinje under Linux henter ned første side av bloggen min, sender eventuelle meldinger til en annen fil ("log") og stripper av HTML-koden slik at det bare blir tekst igjen:
wget http://urbanus.blogspot.com -o log -O - | w3m -T text/html -dump
Tilsvarende kan man bruke på arkivlenkene. Ulempen er at disse har ulikt format avhengig av hva slags bloggeverktøy man bruker, så noe manuelt mikkmakk blir det nok i alle fall. Dessuten må det nok foretas en del redigering på resultatet, siden all tekst kommer med.
Finn en Linux-hacker og få henne til å gjøre jobben. ;-)
Jr det slike som meg som nå skal kartlegges? Analyseres?
Jeg elsker å ligge forran lupen.
http://app.sprayblogg.no/trackback/ping/1880733



