IRIS – Inherently Reasoning Intelligent System

Ett arkitekturprojekt för resonemangsbaserad intelligens med explicit koherens- och moralram.

Problemformulering

Dagens AI-system är i huvudsak träningsbaserade prediktionsmaskiner. De kan vara användbara och ibland imponerande, men deras ”förklaringar” är ofta efterhandskonstruktioner och deras målfunktioner är externa och modifierbara. IRIS syftar till ett system där resonemanget är primärt: ett explicit varför-maskineri med koherensvillkor, snarare än statistik som råkar likna förståelse.

Kärnidé

Säkerhet och ”moral” (operativt menat)

Med ”moral” avses här inte känslor eller mänsklig värdeimitation, utan ett explicit koherenskrav: vissa klasser av mål och beteenden ska vara inkompatibla med systemets stabila tillstånd. Det är i grunden en arkitekturfråga.

Status

IRIS är ett pågående forsknings- och utvecklingsarbete. Ambitionen är hög, men påståenden om funktion eller prestanda bör bedömas först efter oberoende granskning och praktiska prototyper.

Samarbete

Jag söker kontakt med personer eller organisationer som arbetar med AI i systems­kala: arkitektur, säkerhet och formella metoder. Inte ”en app”, utan grundfrågor kring hur robusta, begripliga och styrbara agentiska system byggs.