MC3 informatica sta attualmente sviluppando un Sistema Esperto (in breve SE) in grado di leggere ed interpretare i documenti PDF rappresentanti i bilanci di aziende forniti da Infocamere.
Lo schema di funzionamento dell'applicazione può così essere sintetizzato:

1. Il SE acquisisce i documenti in formato PDF ed XML

2. I file forniti da Infocamere non sono necessariamente bilanci: sulla base dei file XML il SE può rilevare quali PDF devono essere letti per ricercare il bilancio

3. Mediante Tools di lettura di PDF tali documenti vengono ricondotti in una forma conforme con la modalità di funzionamento del SE (xml, testo con notazione posizionale, nodi di una lista contenenti le porzioni di testo,...)

4. I dati così strutturati possono essere presi in carico dal Sistema     a Regole. Quest'ultimo potrebbe essere così suddiviso:

  • Strato di Regole atte ad identificare informazioni strutturali. Questo strato deve permettere di identificare le strutture testuali atte a fornire le informazioni da analizzare quali ad esempio il bilancio e, per future estensioni, la nota integrativa o i dati relativi ai debitori. Mediante queste regole, le informazioni sensibili verranno rese conformi con i dati in ingresso del successivo strato di Regole
  • Il secondo strato di Regole deve permettere di classificare i testi (o numeri) secondo i concetti base definiti nel sistema. I concetti base formano il cuore della base di conoscenza (rappresentano il concetto di assiomi o postulati ). Ogni Regola di questo strato deve cercare di identificare quanto letto in uno dei concetti base definiti. Questo livello sarà quello più ricco di regole che dovranno essere manutenute nel tempo
  • L'ultimo strato di Regole rappresenta le regole di validazione. Tutte le informazioni prodotte dallo strato precedente devono essere validate da questo strato. Le regole a questo livello saranno fondamentalmente più statiche rispetto allo strato precedente anche se avranno bisogno di affinamento durante le fasi di Tuning
5. Tutti gli strati di regole suddetti devono contribuire a raggiungere l'obiettivo preposto. In una prima fase tale obiettivo sarà quello di ottenere un bilancio riclassificato. Poiché ogni regola potrà avere associato un parametro di attendibilità (logica fuzzy) il risultato finale potrà anch'esso essere descritto tramite un valore globale di attendibilità.
Questo meccanismo permette di introdurre il concetto di livello di soglia sotto al quale un bilancio considerato classificato (tutte le regole soddisfatte) viene considerato dal Sistema come poco attendibile e quindi da verificare manualmente. Tale livello di soglia dovrà essere affinato sempre più durante le fasi di Tuning