Gamla nummer
Enstaka nummer kan beställas från vår internetbokhandel.
Det som karaktäriserar data från Demografiska databasen (DDB) i Umeå är att man kan följa varje individ kontinuerligt över tiden, från födelse till död. Varje vital händelse, såsom giftermål, barnafödande och flyttning inom regionen, kan noteras och tidsbestämmas på en dag när.
Det finns också individer i databasen, för vilka fullständiga uppgifter saknas. För det första har vi ett randproblem som består i att databaserna har givna start- och slutdatum. Om ett slutdatum är den 1 januari 1895 och en individ föds den 3 september 1881 och dör den 16 maj 1918, så tappar vi informationen om hennes liv från och med nyårsdagen 1895. För det andra flyttade människor in och ut ur regionen och under de tidsperioder en person är ute har vi ingen information om hans eller hennes vitala händelser. Individer kan också falla bort från observation av andra orsaker.
I klassisk statistisk teori är det svårt att avgöra vad man ska göra med sådan delinformation, som dessa undantag representerar. Det är inte ovanligt att ddb ombeds kartlägga "fullständiga livshistorier", det vill säga beställaren vill bara ha med individer som hela sitt liv finns under observation i regionen.
Nästan oberoende av vilken typ av undersökning beställaren har tänkt sig att göra, så leder sådana urval till icke önskvärda snedheter i de efterföljande analyserna. I en dödlighetsstudie kommer man att överskatta dödligheten. Exempel: Om två lika gamla personer bestämmer sig för att flytta när de fyller 30 och den ene dör före 30 medan den andre dör efter 30, så kommer bara den som dog ung med i urvalet. Lösningen på detta problem med ofullständiga livsförloppsdata heter livsförloppsanalys.
Man beräknade fördelningar för livslängder på elektroniska komponenter i livslängdstest. Ett problem var att många sådana komponenter hade väldigt lång livslängd, så experimenten tog lång tid att utföra. Många försöksenheter fungerade fortfarande när tiden för experimentet var slut.
För att lösa problemet fanns huvudsakligen två vägar att gå. Den första vägen var att utveckla analysmetoder för ofullständiga data (komponenter vars livslängd man inte kände exakt). Begreppet "censurerade data" var tidigt bekant. En banbrytande metod att skatta livslängdsfördelningar från censurerade data beskrevs av Kaplan & Meier (1958). Deras insats var att teoretiskt motivera metoder som redan varit i bruk en längre tid.
Den andra vägen var så kallad accelererad provning. Det gick ut på att utsätta försöksenheterna för onaturligt hög belastning så att de fick kortare livslängd. På så sätt kunde man få mer information på samma tid, men svagheten är uppenbar; man blir tvungen att på något sätt koppla resultaten vid hög belastning till funktionen vid normal belastning. En kanske något långsökt jämförelse är försöken i medicinsk forskning att överföra resultat från djurförsök till mänskliga förhållanden.
Med sjuttiotalets kraftiga datorutveckling förändrades förutsättningarna. 1972 skrev David Cox en artikel i Journal of the Royal Statistical Society som, tillsammans med datorutvecklingen, i ett slag gav statistiken ett nytt forskningsområde och nya tillämpningsområden. David Cox blev 1985 adlad av drottning Elizabeth för sina insatser inom statistiken, vilket antyder betydelsen av hans upptäckt av vad som i dag kallas coxregression.
Resten av sjuttiotalet präglades framför allt av att framstående biostatistiker världen över såg potentialen i den nya teoriutvecklingen för sina egna tillämpningar. Man hade fått ett kraftfullt statistiskt verktyg för analys av kliniska prövningar. Inom cancerforskningen och andra typer av allvarliga sjukdomar, där förväntad överlevnad är kort, gjorde coxregressionen stor succé.
I början av åttiotalet kom de första läroböckerna och snart tog de stora programvaruföretagen upp tråden. Jag blev själv fångad i de nya trenderna då jag som nydisputerad 1979 fick mitt första arbete som forskare på DDB. Mina första tillämpningar av överlevnadsanalys rörde spädbarns- och mödradödlighet i artonhundratalets Tornedalen.
De två sista decennierna av 1900-talet präglades av att livsförloppsanalysen som analysmetod spreds från de tekniska och medicinska tillämpningarna till ekonomi, sociologi och demografi. Ekonomer använder beteckningen durationsmodeller när de studerar in- och utträde på arbetsmarknaden, sjukfrånvaro och betydelsen av arbetsmarknadspolitiska åtgärder när det gäller tiden det tar för en arbetslös att få jobb.
Sociologer och demografer talar om livsförloppsanalys när de studerar familjebildning, utbildning och social välfärd i relation till grundläggande demografiska processer som barnafödande, dödlighet och migration.
En annan viktig orsak till att livsförloppsanalysen fick ett så starkt genomslag var framväxten av många stora databaser med information på individnivå. Klassiska metoder inom demografi arbetade med aggregerade data (befolkningstabeller av olika slag) och dessa metoder kan inte utnyttja den extra information som individbaserade data ger.
Det enklaste exemplet är dödlighet. Det är en lätt situation att analysera därför att händelsen inträffar säkert - förr eller senare - och den kan bara inträffa en gång.
Ett komplicerat exempel är fertilitet. Under uppföljningen av en kvinnas fertila period kan flera händelser, det vill säga barnafödslar, inträffa och det är inte säkert att någon inträffar. Dessutom kommer intensiteten för barnafödande i en viss ålder att bero på kvinnans tidigare födandehistoria.
I projektet "Intergenerationella processer i demografi; fertilitet och spädbarnsdödlighet" studerar vi spädbarnsdödlighet och fertilitet och relationen dem emellan. Låt oss som illustration titta på spädbarnsdödlighet isolerat. I ett livsförloppsperspektiv följer vi då varje nyfödd från födelsen till ettårsdagen eller, om hon dör tidigare, till dödsdagen.
Några klassiska frågeställningar är om det är någon skillnad i spädbarnsdödlighet beroende på föräldrarnas (mammans) civilstånd och om flickor har lägre dödlighet än pojkar. Ett sätt att illustrera skillnaderna mellan grupper är att skatta den kumulativa intensitetsfunktionen för varje grupp och jämföra dem i en graf (OBS att figurer och bilder endast publiceras i den tryckta versionen av Tvärsnitt).
Vi ser att risken för barn födda utom äktenskapet ("oäkta") är mycket högre än för barn födda inom äktenskapet ("äkta"). Beteckningen "oäkta" för barn födda utom äktenskapet användes av prästerna på 1800-talet. Vi ser också att pojkar har högre dödlighet än flickor. Frågan är om dessa observerade skillnader är statistiskt signifikanta. Det kan vi avgöra med coxregression. Resultatet blir enligt tabellerna ovan (OBS att figurer och bilder endast publiceras i den tryckta versionen av Tvärsnitt):
De skillnader vi kan se i figuren verifieras som mycket starkt statistiskt signifikanta av analysen (pvärden ungefär 0). Är då de uppmätta skillnaderna också praktiskt betydelsefulla? Ja, ur riskkvoterna ser vi att dödligheten för oäkta barn är 31,3 procent högre än den för äkta och att flickor har en dödlighet som är 17,8 procent lägre än pojkars. Detta får man nog kalla betydelsefulla skillnader.
Vad gäller spädbarnsdödlighet i 1800-talets Sverige så visar det sig att den tenderar att drabba vissa familjer mer än andra, utöver vad som kan förklaras av tillgänglig information, till exempel i en coxregression. I projektet "Intergenerationella processer i demografi; fertilitet och spädbarnsdödlighet" ska vi undersöka just detta fenomen, framför allt i ett flergenerationellt perspektiv och hur det samverkar med barnafödande. Finns det mönster som går i arv mellan generationer? Svaren vet vi inte än, så det finns säkert anledning att återkomma framöver.

Demografiska databasen (DDB) är en särskild enhet vid Umeå universitet inriktad på dataproduktion och forskning.
DDB producerar och gör befolkningsdatabaser tillgängliga med historisk information främst baserad på kyrkböcker från 1700- och 1800-talen.
Databasen innehåller uppgifter från kyrkböcker för sammanlagt ett 80-tal församlingar.
Det speciella med databasen är att alla uppgifter kring personerna i kyrkböckerna har länkats, vilket gör att de kan följas genom livet i församlingarna.
DDB bedriver verksamhet på fyra orter. Förutom forsknings- och utvecklingsenheten i Umeå finns också tre produktionsenheter, i Haparanda, Jörn och Karesuando.
För mer information, se: www.ddb.umu.se