(Courriels de diversion: <accumulation@allient-recrimine.com> <cachetteriez@blagueuse-decollement.com> <exceptant@frileux-etheres.com> <suppliciee@tenables-coïncidents.com> <ombragee@pardonnons-malthusiennes.com> <arche@designeriez-cabale.com> <sifflerais@decotes-precede.com> <heteroclites@selliers-decervelage.com> <decapotable@fructifiaient-compatissions.com> <deminerait@prejugez-valoriserions.com> )



Je profite de ce message croisé sur la liste Debian pour vous signaler que 
j'ai fais également des essais d'OCR avec gocr il y a quelques jours. Mes 
résultats sont assez similaires à ce qu'on peut lire dans le message.

Bonne reconnaissance générale. 
Mauvaise reconnaissance des caractères accentués.
Pas de reconstitution des mots césurés.

En plus, pour obtenir ce niveau de reconnaissance, il faut jouer sur les 
paramètres du scanner ou effectuer un post traitement sur l'image, ce qui 
prend pas mal de place quand on scanne à 600 dpi.

Je comptais justement chercher un peu plus comment ces traitements peuvent 
s'automatiser pour un handicapé. Cela n'est pas évident, car ils doivent 
dépendre largement de la qualité du papier, donc varier d'un document à 
l'autre. Il faudra qu'on en parle à l'occasion.

Un autre point qui doît faire l'objet d'attention est l'alignement du texte. 
Le scan doit être bien droit pour obtenir un taux de reconnaissance 
important.

A+
CPHIL

----------  Message transmis  ----------

Subject: Re: OCR
Date: Sun, 26 May 2002 14:18:27 +0200
From: sylvain Debeux <sylvain.debeux@free.fr>To: debian-user-french@lists.debian.org
On Sun, 26 May 2002 13:03:47 +0200

Adeimantos <delange@imaginet.fr> wrote:> Existe t-il un bon système de reconnaissance de caractères [OCR] sous
> Debian? J'ai 300 pages à saisir et à mettre en pages dans un ordre
> différent (ça s'appelle fabriquer un bouquin). Il me faut ainsi:
>
> a) un bon scanner
> b) un bon logiciel
> c) du temps
>
> Des idées? Merci
>
> JP

salut

alors, je suis arrivé à qqe chose avec gocr : scan du texte en 600 dpi,
 enregistrement en tiff, conversion en pnm avec gimp ; je n'ai pas fait de
 traitement de l'image; donc pires conditions pour un essai : mon scanner est
 un bete snapscan 1212 USB
le resultat brut sans options particulieres (gocr fonctionne en ligne de
 commande) donne ceci:

""""
 Le domaine de 1a securite informatique est un sujet des
 plus complexes, mais reste incontournable. L'eventualité
 de dysfonctionnements dans les programmes est plutót
 connue maintenant, mais il est egalement possible de
 creer des problèmes de sécurite en combinant des logi-
 ciels qui f_nctionnent << sans erreur >>.
 Des environnements et des tâches complexes reQuierent
 des systemes d'information eux-mêmes plutôt complexes
 et obscurs.
 Sans 1imitation des acces, les données peuvent être alte-
 rees frauduleusement en secret. Ce type de probleme
 devient tangible 1orsqu'on imagine des hôpitaux infor-
 matisés, par exemple. L'op.posé, a savoir une limitation

"""

ce qui me semble un resultat des plus interessant vu les conditions de
 l'experience. une retouche luminosité-contraste simple va donner ceci en
 brit

"""""Le domaine de 1a securité informatique est un sujet des
 plus complexes, mais reste incontournable. L'eventualité
 de dysfonctionnements dans 1es programmes est plutot
 connue maintenant, mais il est également possible de
 creer des problèmes de securite en combinant des 1ogi-
 ciels Qui fonctionnent << sans erreur >>.
 Des environnements et des tâches complexes requièrent
 des systëmes d'information eux-memes plutôt complexes
 et obscurs.
 Sans 1imitation des accès, 1es donnees peuvent être alte-
 rees frauduleusement en secret. Ce type de problème
 devient tangible lorsqu'on imagine des hôpitaux infor-
 matises, par exemple. L'oppose, a savoir une limitation

""""""
j'ai trouvé aussi gocr-tk qui permet de piloter tout ca via une interface
 (notamment scanner directement)

voila, je vais poursuivre les essais

j'ai aussi essayé clara mais je n'arrive pas à produire un format qu'il
 puisse lire

amicalement


--
=================================================
Sylvain DEBEUX          (Sylvain.Debeux@free.fr)ICQ:3985176 Proteus    http://sylvain.debeux.free.fr/
=================================================


--
To UNSUBSCRIBE, email to debian-user-french-request@lists.debian.orgwith a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
-------------------------------------------------------

-- 
Je veux rester tel un sou neuf, l'hurluberlu qui sort de l'œuf
Je veux demeurer tout fou 
Toutou tout fou-fou-ou
	-- Richard Gotainer "Tout foufou"


---------------------------------------------------------------------
To unsubscribe, e-mail: biglux-unsubscribe@savage.iut-blagnac.frFor additional commands, e-mail: biglux-help@savage.iut-blagnac.fr