Från ostrukturerade domstolsdokument till maskinläsbar rättspraxis.
Ingestion och bearbetning
Varje avgörande går igenom en deterministisk pipeline med sju steg. Varje steg producerar strukturerad data och en konfidensbedömning. Pipelinen är idempotent — samma dokument kan köras igen utan bieffekter.
PDF / HTML-källa ↓ pdf_validator → storlek, content-type pdf_reader → råtext (pdfplumber) JudgmentPipeline ├─ HeaderExtractor → domstol, målnummer, datum ├─ SectionParser → strukturerade textsektioner ├─ EntityExtractor → domare, åklagare, försvarare ├─ SideExtractor → advokat → plaintiff/defendant ├─ OutcomeExtractor → utfallskod (7 möjliga) ├─ SentenceExtractor → påföljd, månader, böter └─ LegalReferenceExtractor → lagrum ↓ JudgmentRepository → PostgreSQL
Sju specialiserade extractors
Extraherar domstolsnamn, målnummer och beslutsdatum från dokumenthuvudet.
Stöd för alla svenska domstolsformat — tingsrätt, hovrätt och HD.
Delar upp dokumentet i strukturerade sektioner baserat på versala rubriker: DOMSLUT, DOMSKÄL, YRKANDEN, med flera.
Övriga extractors arbetar mot specifika sektioner, inte råtexten.
Identifierar domare, åklagare, försvarare och tilltalade med namndeduplicering.
spaCy NER som fallback för ostrukturerade partssektioner.
Kopplar advokat till kärande eller svarande baserat på kontextmarkörer i OMBUD-sektionen.
Korrekt side-attribution är förutsättning för sidojusterad vinstrateanalys.
Klassificerar utfall i sju koder: DÖMD, FRIKÄND, AVSKRIVEN, BIFALL, DELVIS_BIFALL, AVVISAT, AVSLAG.
Brottmålskoder kontrolleras före civilmålskoder för att förhindra korsklassning.
Extraherar påföljdstyp, fängelsetid i månader och bötesbelopp från DOMSLUT-sektionen.
Sex påföljdstyper i prioritetsordning — villkorlig dom kontrolleras före fängelse.
Extraherar lagrum i sex mönsterformat — från "8 kap. 4 § brottsbalken" till förkortningskoden "BrB 3:1".
Span-spårning förhindrar att ett lagrum matchas av flera mönster.
Källor och indexering
AI-assisterad analys
Utöver den deterministiska pipelinen har Lexifi en experimentell AI-assisterad analys via Anthropics Claude. Analysen producerar åtta strukturerade dimensioner — faktapåståenden, bevisvärdering, rättslig kvalificering, försvarets strategi, åklagarens teori, påföljdsanalys, kritiska faktorer och observationer.