OCR : découverte de Prizmo pour iPhone

Florian Innocente |

Prizmo la solution d'OCR de poche de Creaceed est disponible sur l'App Store (7,99€). Cet utilitaire - à l'interface très soignée - se propose de scanner des cartes de visite, des passages de textes (ce peut être un article ou un tableau blanc) ou même des notes de courses ou restaurant lorsqu'il s'agit que chacun paye son écot. L'appareil photo des iPhone 4 et 3GS sera le mieux loti, ceux des 3G et Edge manquant de précision.

La photo de la carte de visite se fait de manière classique ou en la déclenchant à la voix en prononçant distinctement "Photographier" (si on a les mains occupées à stabiliser l'iPhone).

On peut aussi piocher dans l'album de l'iPhone lorsqu'on a déjà un stock de photos de cartes. Ensuite on bascule dans un mode d'édition avec quelques outils pour améliorer la prise de vue. Réorienter l'image, la recadrer, la remettre à plat si elle présentait une perspective, revoir sa balance des blancs ou l'optimiser si elle présente un texte en blanc sur un fond sombre.

Ceci fait, les infos reconnues sont placées dans un formulaire dont on peut revoir ou valider les intitulés très rapidement, les plus courants sont prédéfinis (Nom, Prénom, Fonction…). Les renseignements inutiles peuvent être supprimés tout aussi facilement et, bonne idée, une petite zone de prévisualisation en haut de l'écran montre la photo de la carte lorsqu'on a besoin d'appliquer une correction dans un champ sans se tromper.

Une fois la fiche corrigée et complète on peut l'envoyer directement sur son compte Dropbox ou CloudApp sous la forme d'une image ou, mieux, comme un fichier vCard réutilisable dans Carnet d'adresses. Prizmo gère le multitâche d'iOS 4 et sait exécuter ce transfert en tâche de fond.

Avec les quelques cartes testées, les résultats ont été variables, mais plutôt positifs dans l'ensemble et parfois même assez bons. Les corrections à apporter n'étaient pas légion. On a vu par exemple le logiciel buter sur des "l" minuscules qu'il confondait avec une parenthèse un peu stylisée (ou l'inverse). Des "i" aussi n'ont pas été correctement interprétés et à certaines occasions des numéros de téléphone devaient être complétés. Mais cela restait plus rapide que de saisir la carte à la main de zéro.

Cependant avec la variété des cartes de visite que l'on peut recevoir, il y a une part non négligeable d'aléatoire. Il faudra parfois veiller à bien préparer son image avant l'étape d'OCR. Une de nos cartes avec texte blanc sur un fond bleu foncé a d'abord laissé le logiciel de marbre, il n'y voyait aucun texte. En recadrant l'image au plus serré autour des éléments essentiels et en jouant sur la balance des blancs le texte a été plutôt bien repris. Des opérations que l'on fait en quelques secondes, l'analyse elle-même ne prenant guère que 4 à 5 secondes.

Les auteurs du logiciels ont néanmoins prévu de donner sur leur site quelques conseils de base pour s'assurer de bons résultats de manière régulière.

Nous avons aussi essayé avec deux textes d'un journal. Le premier essai a été désastreux, mais le second était globalement bien repris avec juste quelques corrections nécessaires ça et là. Lors du deuxième essai la photographie était davantage face à l'appareil photo, ce qui a pu contribuer à améliorer le résultat.

Autre bonne idée, le texte obtenu sera traduit, au sein de l'application, par une fonction Google Translate, avec de nombreuses langues à la clef. On pourra aussi demander à ce qu'il soit lu à haute voix. Mais dans ce cas il faudra acheter une voix de synthèse (plusieurs, de différentes langues, masculines comme féminines, sont proposées), comptez 2,39€ chacune. Dommage qu'il n'y en ait pas au moins une d'offerte.

Plus anecdotique, peut-être, la fonction de partage d'une note de restaurant ou une facture de courses (nous n'avons pu l'essayer qu'avec une seule). Le logiciel sépare la colonne des achats de celles des tarifs (on peut ajuster les colonnes manuellement). Puis une fois les champs établis et la liste des personnes créée, on va affecter à chacun les plats ou boissons revenant à sa charge.

Même si l'interface est excellente, on est plus circonspect sur l'utilité réelle de cette fonction. Entre le scan, l'OCR (en partant du principe qu'elle va bien fonctionner, par exemple le 2.10 € traduit en 21,00 € dans notre exemple) et la répartition des commandes, il n'est pas interdit de penser qu'on aura plus vite fait avec la calculatrice de l'iPhone… Mais il y a de quoi au moins amuser une tablée en fin de repas !

Comme toutes les applications d'OCR, Prizmo ne peut prétendre au 100% de reconnaissance. Il faudra parfois s'y reprendre à deux fois pour obtenir le résultat souhaité et il très probable que des cartes un peu trop graphiques poseront problème. Mais le logiciel peut aussi très bien se débrouiller. Un peu de pratique et d'habitude devraient réduire les mauvaises surprises. L'interface ensuite est extrêmement bien réalisée, assez ludique et avec une intégration Dropbox bienvenue.

Accédez aux commentaires de l'article