Infrastruktur

Från ostrukturerade domstolsdokument till maskinläsbar rättspraxis.

PIPELINE

Ingestion och bearbetning

Varje avgörande går igenom en deterministisk pipeline med sju steg. Varje steg producerar strukturerad data och en konfidensbedömning. Pipelinen är idempotent, samma dokument kan köras igen utan bieffekter.

PDF / HTML-källa
  ↓
pdf_validator      → storlek, content-type
pdf_reader         → råtext (pdfplumber)
JudgmentPipeline
  ├─ HeaderExtractor         → domstol, målnummer, datum
  ├─ SectionParser           → strukturerade textsektioner
  ├─ EntityExtractor         → domare, åklagare, försvarare
  ├─ SideExtractor           → advokat → plaintiff/defendant
  ├─ OutcomeExtractor        → utfallskod (7 möjliga)
  ├─ SentenceExtractor       → påföljd, månader, böter
  └─ LegalReferenceExtractor → lagrum
  ↓
JudgmentRepository → PostgreSQL

EXTRACTORS

Sju specialiserade extractors

01 / HEADEREXTRACTOR

Extraherar domstolsnamn, målnummer och beslutsdatum från dokumenthuvudet.

Stöd för alla svenska domstolsformat: tingsrätt, hovrätt och HD.

02 / SECTIONPARSER

Delar upp dokumentet i strukturerade sektioner baserat på versala rubriker: DOMSLUT, DOMSKÄL, YRKANDEN, med flera.

Övriga extractors arbetar mot specifika sektioner, inte råtexten.

03 / ENTITYEXTRACTOR

Identifierar domare, åklagare, försvarare och tilltalade med namndeduplicering.

spaCy NER som fallback för ostrukturerade partssektioner.

04 / SIDEEXTRACTOR

Kopplar advokat till kärande eller svarande baserat på kontextmarkörer i OMBUD-sektionen.

Korrekt side-attribution är förutsättning för sidojusterad vinstrateanalys.

05 / OUTCOMEEXTRACTOR

Klassificerar utfall i sju koder: DÖMD, FRIKÄND, AVSKRIVEN, BIFALL, DELVIS_BIFALL, AVVISAT, AVSLAG.

Brottmålskoder kontrolleras före civilmålskoder för att förhindra korsklassning.

06 / SENTENCEEXTRACTOR

Extraherar påföljdstyp, fängelsetid i månader och bötesbelopp från DOMSLUT-sektionen.

Sex påföljdstyper i prioritetsordning, villkorlig dom kontrolleras före fängelse.

07 / LEGALREFERENCEEXTRACTOR

Extraherar lagrum i sex mönsterformat, från "8 kap. 4 § brottsbalken" till förkortningskoden "BrB 3:1".

Span-spårning förhindrar att ett lagrum matchas av flera mönster.

DATAKÄLLOR

Källor och indexering

Domstolsverket

Öppen data-dataset. Primär källa för HD-avgöranden med bifogade PDF-filer.

Rättspraxis API

Täcker HD, HFD och samtliga sex hovrätter. Fulltext i HTML-format.

Enskilda hovrätter

Svea hovrätt, Göta hovrätt, HVS, HON, HNN, HSB och ADO.

Indexeringsfrekvens

Löpande batch-ingest med deduplicering via SHA-256-checksumma.

Versionshantering

Tidigare versioner av samma avgörande bevaras, ny körning skriver inte över.

AI-PIPELINE

AI-assisterad analys

Utöver den deterministiska pipelinen har Lexifi en experimentell AI-assisterad analys via Anthropics Claude. Analysen producerar åtta strukturerade dimensioner: faktapåståenden, bevisvärdering, rättslig kvalificering, försvarets strategi, åklagarens teori, påföljdsanalys, kritiska faktorer och observationer.

Källspårning

Varje påstående kopplas till specifik del av avgörandetexten.

Hallucinationskontroll

Strukturerat JSON-schema med output_config.format, modellen kan inte avvika från schemat.

Adaptive thinking

claude-opus-4-6 med adaptivt resonemang för komplexa juridiska bedömningar.

Ingen persistent lagring

AI-analyser körs on-demand och lagras inte om inte användaren begär det.

STACK

Teknisk stack

Backend

Python 3.11 · FastAPI · SQLAlchemy · Pydantic v2 · Alembic

Databas

PostgreSQL med 10 tabeller och 19 migrationsversioner

scikit-learn: LogisticRegression (conviction) · GradientBoostingRegressor (sentence)

Anthropic Claude claude-opus-4-6 med strukturerad JSON-output

Frontend

Next.js 15 App Router · TypeScript · Tailwind v4 · Recharts

Hosting

Render (FastAPI) · Vercel (Next.js) · EU-region

Juridiskt

Utgivningsbevis under förberedelse · GDPR-konform

Boka demo Anmäl intresse för pilotprogram