LEXIFIBoka demo
Infrastruktur

Från ostrukturerade domstolsdokument till maskinläsbar rättspraxis.

PIPELINE

Ingestion och bearbetning

Varje avgörande går igenom en deterministisk pipeline med sju steg. Varje steg producerar strukturerad data och en konfidensbedömning. Pipelinen är idempotent — samma dokument kan köras igen utan bieffekter.

PDF / HTML-källa
  ↓
pdf_validator      → storlek, content-type
pdf_reader         → råtext (pdfplumber)
JudgmentPipeline
  ├─ HeaderExtractor         → domstol, målnummer, datum
  ├─ SectionParser           → strukturerade textsektioner
  ├─ EntityExtractor         → domare, åklagare, försvarare
  ├─ SideExtractor           → advokat → plaintiff/defendant
  ├─ OutcomeExtractor        → utfallskod (7 möjliga)
  ├─ SentenceExtractor       → påföljd, månader, böter
  └─ LegalReferenceExtractor → lagrum
  ↓
JudgmentRepository → PostgreSQL
EXTRACTORS

Sju specialiserade extractors

01 / HEADEREXTRACTOR

Extraherar domstolsnamn, målnummer och beslutsdatum från dokumenthuvudet.

Stöd för alla svenska domstolsformat — tingsrätt, hovrätt och HD.

02 / SECTIONPARSER

Delar upp dokumentet i strukturerade sektioner baserat på versala rubriker: DOMSLUT, DOMSKÄL, YRKANDEN, med flera.

Övriga extractors arbetar mot specifika sektioner, inte råtexten.

03 / ENTITYEXTRACTOR

Identifierar domare, åklagare, försvarare och tilltalade med namndeduplicering.

spaCy NER som fallback för ostrukturerade partssektioner.

04 / SIDEEXTRACTOR

Kopplar advokat till kärande eller svarande baserat på kontextmarkörer i OMBUD-sektionen.

Korrekt side-attribution är förutsättning för sidojusterad vinstrateanalys.

05 / OUTCOMEEXTRACTOR

Klassificerar utfall i sju koder: DÖMD, FRIKÄND, AVSKRIVEN, BIFALL, DELVIS_BIFALL, AVVISAT, AVSLAG.

Brottmålskoder kontrolleras före civilmålskoder för att förhindra korsklassning.

06 / SENTENCEEXTRACTOR

Extraherar påföljdstyp, fängelsetid i månader och bötesbelopp från DOMSLUT-sektionen.

Sex påföljdstyper i prioritetsordning — villkorlig dom kontrolleras före fängelse.

07 / LEGALREFERENCEEXTRACTOR

Extraherar lagrum i sex mönsterformat — från "8 kap. 4 § brottsbalken" till förkortningskoden "BrB 3:1".

Span-spårning förhindrar att ett lagrum matchas av flera mönster.

DATAKÄLLOR

Källor och indexering

Domstolsverket
Öppen data-dataset. Primär källa för HD-avgöranden med bifogade PDF-filer.
Rättspraxis API
Täcker HD, HFD och samtliga sex hovrätter. Fulltext i HTML-format.
Enskilda hovrätter
Svea hovrätt, Göta hovrätt, HVS, HON, HNN, HSB och ADO.
Indexeringsfrekvens
Löpande batch-ingest med deduplicering via SHA-256-checksumma.
Versionshantering
Tidigare versioner av samma avgörande bevaras — ny körning skriver inte över.
AI-PIPELINE

AI-assisterad analys

Utöver den deterministiska pipelinen har Lexifi en experimentell AI-assisterad analys via Anthropics Claude. Analysen producerar åtta strukturerade dimensioner — faktapåståenden, bevisvärdering, rättslig kvalificering, försvarets strategi, åklagarens teori, påföljdsanalys, kritiska faktorer och observationer.

Källspårning
Varje påstående kopplas till specifik del av avgörandetexten.
Hallucinationskontroll
Strukturerat JSON-schema med output_config.format — modellen kan inte avvika från schemat.
Adaptive thinking
claude-opus-4-6 med adaptivt resonemang för komplexa juridiska bedömningar.
Ingen persistent lagring
AI-analyser körs on-demand och lagras inte om inte användaren begär det.
STACK

Teknisk stack

Backend
Python 3.11 · FastAPI · SQLAlchemy · Pydantic v2 · Alembic
Databas
PostgreSQL med 10 tabeller och 19 migrationsversioner
ML
scikit-learn: LogisticRegression (conviction) · GradientBoostingRegressor (sentence)
AI
Anthropic Claude claude-opus-4-6 med strukturerad JSON-output
Frontend
Next.js 15 App Router · TypeScript · Tailwind v4 · Recharts
Hosting
Render (FastAPI) · Vercel (Next.js) · EU-region
Juridiskt
Utgivningsbevis under förberedelse · GDPR-konform