OCR : découverte de Prizmo pour iPhone

Florian Innocente |

Prizmo la solution d'OCR de poche de Creaceed est disponible sur l'App Store (7,99€). Cet utilitaire - à l'interface très soignée - se propose de scanner des cartes de visite, des passages de textes (ce peut être un article ou un tableau blanc) ou même des notes de courses ou restaurant lorsqu'il s'agit que chacun paye son écot. L'appareil photo des iPhone 4 et 3GS sera le mieux loti, ceux des 3G et Edge manquant de précision.

La photo de la carte de visite se fait de manière classique ou en la déclenchant à la voix en prononçant distinctement "Photographier" (si on a les mains occupées à stabiliser l'iPhone).

On peut aussi piocher dans l'album de l'iPhone lorsqu'on a déjà un stock de photos de cartes. Ensuite on bascule dans un mode d'édition avec quelques outils pour améliorer la prise de vue. Réorienter l'image, la recadrer, la remettre à plat si elle présentait une perspective, revoir sa balance des blancs ou l'optimiser si elle présente un texte en blanc sur un fond sombre.

prizmo1

Ceci fait, les infos reconnues sont placées dans un formulaire dont on peut revoir ou valider les intitulés très rapidement, les plus courants sont prédéfinis (Nom, Prénom, Fonction…). Les renseignements inutiles peuvent être supprimés tout aussi facilement et, bonne idée, une petite zone de prévisualisation en haut de l'écran montre la photo de la carte lorsqu'on a besoin d'appliquer une correction dans un champ sans se tromper.

prizmo2

Une fois la fiche corrigée et complète on peut l'envoyer directement sur son compte Dropbox ou CloudApp sous la forme d'une image ou, mieux, comme un fichier vCard réutilisable dans Carnet d'adresses. Prizmo gère le multitâche d'iOS 4 et sait exécuter ce transfert en tâche de fond.

Avec les quelques cartes testées, les résultats ont été variables, mais plutôt positifs dans l'ensemble et parfois même assez bons. Les corrections à apporter n'étaient pas légion. On a vu par exemple le logiciel buter sur des "l" minuscules qu'il confondait avec une parenthèse un peu stylisée (ou l'inverse). Des "i" aussi n'ont pas été correctement interprétés et à certaines occasions des numéros de téléphone devaient être complétés. Mais cela restait plus rapide que de saisir la carte à la main de zéro.

prizmo4

Cependant avec la variété des cartes de visite que l'on peut recevoir, il y a une part non négligeable d'aléatoire. Il faudra parfois veiller à bien préparer son image avant l'étape d'OCR. Une de nos cartes avec texte blanc sur un fond bleu foncé a d'abord laissé le logiciel de marbre, il n'y voyait aucun texte. En recadrant l'image au plus serré autour des éléments essentiels et en jouant sur la balance des blancs le texte a été plutôt bien repris. Des opérations que l'on fait en quelques secondes, l'analyse elle-même ne prenant guère que 4 à 5 secondes.

Les auteurs du logiciels ont néanmoins prévu de donner sur leur site quelques conseils de base pour s'assurer de bons résultats de manière régulière.

Nous avons aussi essayé avec deux textes d'un journal. Le premier essai a été désastreux, mais le second était globalement bien repris avec juste quelques corrections nécessaires ça et là. Lors du deuxième essai la photographie était davantage face à l'appareil photo, ce qui a pu contribuer à améliorer le résultat.

prizmocanard2
prizmocanard2

Autre bonne idée, le texte obtenu sera traduit, au sein de l'application, par une fonction Google Translate, avec de nombreuses langues à la clef. On pourra aussi demander à ce qu'il soit lu à haute voix. Mais dans ce cas il faudra acheter une voix de synthèse (plusieurs, de différentes langues, masculines comme féminines, sont proposées), comptez 2,39€ chacune. Dommage qu'il n'y en ait pas au moins une d'offerte.

prizmolangues

Plus anecdotique, peut-être, la fonction de partage d'une note de restaurant ou une facture de courses (nous n'avons pu l'essayer qu'avec une seule). Le logiciel sépare la colonne des achats de celles des tarifs (on peut ajuster les colonnes manuellement). Puis une fois les champs établis et la liste des personnes créée, on va affecter à chacun les plats ou boissons revenant à sa charge.

prizmonotes11

Même si l'interface est excellente, on est plus circonspect sur l'utilité réelle de cette fonction. Entre le scan, l'OCR (en partant du principe qu'elle va bien fonctionner, par exemple le 2.10 € traduit en 21,00 € dans notre exemple) et la répartition des commandes, il n'est pas interdit de penser qu'on aura plus vite fait avec la calculatrice de l'iPhone… Mais il y a de quoi au moins amuser une tablée en fin de repas !

prizmonote22

Comme toutes les applications d'OCR, Prizmo ne peut prétendre au 100% de reconnaissance. Il faudra parfois s'y reprendre à deux fois pour obtenir le résultat souhaité et il très probable que des cartes un peu trop graphiques poseront problème. Mais le logiciel peut aussi très bien se débrouiller. Un peu de pratique et d'habitude devraient réduire les mauvaises surprises. L'interface ensuite est extrêmement bien réalisée, assez ludique et avec une intégration Dropbox bienvenue.


Tags
avatar legeox | 
Super si ça fonctionne aussi bien. Mais bon, 7.99€, faut en avoir l'utilité au quotidien!
avatar Tibimac | 
Très mal notée sur l'AppleStore... A près de 8 €, on n'a quand même pas envie de ne pas se précipiter, même si la version mac est plutôt correcte.
avatar Tibimac | 
Oui, mais là, ce qui est critiqué, c'est clairement la qualité de la reconnaissance. Maintenant, si vous avez eu d'excellents résultats, je n'ai pas de raison de ne pas vous croire, d'autant que la version mac, je le répète, est de bonne facture...
avatar Fabricius | 
Il faut tout de même noter que les 2 utilisateurs qui ont mis ces notes sont incapables d'écrire une phrase correcte au niveau des accents, de la typographie, des accords, de la capitalisation et j'en passe. S'ils utilisent des pages du Bescherelle pour leurs tests, c'est clair que les résultats doivent les surprendre.
avatar Tibimac | 
> bigham [18.08.2010 - 18:42] Il faut tout de même noter que les 2 utilisateurs qui ont mis ces notes sont incapables d'écrire une phrase correcte [...] Pas faux...
avatar iplouch | 
Ah, nostalgie, l'ancienne carte de MacG :-) Je dois en avoir encore une pile qui traine quelque part...
avatar thEV4Nne | 
Ça alors, un utilisateur avec plus de 10 ans d'historique ! À part Dieux lui-même et celui qui a inventé le web, qui peut bien avoir plus de 10 ans d'historique ?!
avatar shenmue_fan | 
Super, merci pour la review Florian! Pour la reconnaissance, c'est la même que dans la version Mac (OpenRTK), et que dans Typereader (300$). On a testé pas mal de technos avant de choisir celle-là. On a tuné la binarisation pour les conditions variables des photos, et on arrive en général à des résultats très bons. Mais, y a pas de miracle, faut une image de qualité. On va d'ailleurs préparer des FAQ pour expliquer comment prendre des photos exploitables par l'OCR. Oui, le prix est peut-être un peu élevé, mais il a fallu 6 mois à plusieurs développeurs, et 2 partenaires technologiques. Notre objectif est d'avoir une app de qualité et utile. Note: Vous pouvez tester Prizmo Mac (la démo) avec des photos iPhone, cela vous donnera une idée des perfs de l'OCR (c'est le même).
avatar Tibimac | 
> Oui, le prix est peut-être un peu élevé Non, pas par rapport aux concurrents, qui, pour la plupart m'ont bien déçu, c'est pour ça que je suis méfiant. Mais si le résultat est effectivement au rendez vous, je trouve le prix très correct. Le problème, c'est d'être certain que votre logiciel est un cran au dessus des multiples applications qui occupent ce créneau...
avatar shenmue_fan | 
On peut essayer de demander cela à notre partenaire, dans quelle mesure on pourrait faire ça. On va creuser cette piste...
avatar hoovertoulouse | 
Je viens d'acheter l'application et je la trouve vraiment pas mal du tout. Quelques petites imperfections comme l'a souligné l'auteur de l'article (s'y reprendre à 2 fois par moment), mais rien de bien méchant. Je vais en avoir l'utilité dès demain matin ! ^^
avatar Tibimac | 
> Geekunivers [18.08.2010 - 18:48] Je viens d'acheter l'application et je la trouve vraiment pas mal du tout. Possèdes tu, par hasard, d'autres applications de ce genre et as-tu pu comparer ? (rien de polémique, je préfère préciser, c'est juste que cette appli m'intéresse bien aussi et que j'aimerais bien savoir si elle est vraiment au dessus des autres...)
avatar hoovertoulouse | 
@Bigdidou Désolé, je n'ai que cette application pour cette fonction sur mon iPhone. A ma connaissance, il n'y en a pas d'autres, mais je peux me tromper. Sur Mac par contre, il y en a beaucoup plus. Si j'ai décidé d'acheter l'application Prizmo iPhone c'est parce que je possède déjà la version Mac et que je n'ai pas été déçu jusqu'à présent. ;-)
avatar Ardzii | 
Oui... ça a l'air très moyen tout ça (voir journal et note de resto). Le probleme avec l'Ocr, c'est qu'a partir du moment ou ce n'est pas parfait (ou si vous n'avez pas une entière confiance au soft), vous perdez un temps fou a tout relire et a comparer (parfois une simple saisie est plus rapide). Je pense que nous devrions tous (moi compris) dire que quelque chose est très bien... quand c'est vraiment très bien et arrêter de positiver sur ce qui est médiocre ou moyen, ça poussera peut être les... développeurs, fabricants d'ordi, de machines a laver, de téléphones, de mixeurs, de rasoirs, de stylo etc. etc. etc. a s'orienter vers la qualité et donner pleine satisfactions a leurs clients. Regardez autour de vous, la qualité est en légère voie de disparition. Désolé si j'ai poussé mon petit quart d'heure de rogne chez vous..., mais ça fait du bien. :) Bonne soirée.
avatar GaelW-Mac | 
>poulpenstring [18.08.2010 - 19:01] Regardez autour de vous, la qualité est en légère voie de disparition. Je suis tout à fait d'accord : Mon frigo a rendu l'âme au bout de 4 ans, alors que celui de mon grand-père a... 48 ans (C'est un Vendome) !! Nath
avatar Robin9 | 
J'ai acheté et testé et j'ai été très déçu par la reconnaissance de texte. Notamment de lignes de code Objective C (par exemple). Sinon pour les cartes de visite cela fonctionne assez bien. Je gage que le prix initial suppose de nombreuses mise à jour qui amélioreront ce point. L'application dans son ensemble respire la qualité et j'ai donc bon espoir.
avatar shenmue_fan | 
C'est normal, on a juste un parser pour le Java pour l'instant ;-) Plus sérieusement, OCR sur une photo de ton écran? Si c'est le cas, et bien l'écran en effet n'a pas une résolution suffisante pour avoir de bons résultats. Mais si tu imprimes le code et le passes dans Prizmo, ca devrait bien marcher. Sinon, le copier/coller sur ordi c'est bien aussi... On voudrait aller plus loin sur la capture d'écran, mais c'est du + long terme comme objectif (réalisation de filtres spécifiques). On a aussi beaucoup d'autres idées d'amélioration de Prizmo et tout le feedback utilisateurs à intégrer (déjà beaucoup...). D'ailleurs, la 1.0.1 est déjà dans le pipe.

CONNEXION UTILISATEUR