OCR gratuit

Tout ce qui concerne notamment les outils de calcul numérique, de calcul formel ou de géométrie.
[participation réservée aux utilisateurs inscrits]
Règles du forum
Merci de soigner la rédaction de vos messages et de consulter ce sujet avant de poster. Pensez également à utiliser la fonction recherche du forum.
dessosos

OCR gratuit

Message non lu par dessosos »

bonjour,

je recherche un ocr gratuit pour passer des docs pdf à word..

Merci pour vos suggestions
Mikelenain
Utilisateur chevronné
Utilisateur chevronné
Messages : 2656
Inscription : dimanche 28 février 2010, 11:54
Localisation : Région Lyonnaise

Re: OCR gratuit

Message non lu par Mikelenain »

"L'ignorance n'est pas ne pas connaître, c'est ne pas vouloir connaître."

Une ch'tio peu d'pub :Ina-Ich

Ubuntu | LibreOffice | GnuPlot | PidGin | irssi | Mozilla | VLC ...
Framboise
Utilisateur chevronné
Utilisateur chevronné
Messages : 1174
Inscription : lundi 21 mai 2007, 13:57
Statut actuel : Autre
Localisation : Dordogne

Re: OCR gratuit

Message non lu par Framboise »

Bonjour,

Si les pdf sont des images, il faut passer par un OCR comme tu l'envisages.
Acrobat ( pas Acrobat Reader ! ) a une telle fonction d'OCR, mais pas gratuit...
Cependant, les pdf sont très souvent du texte avec mise en forme ayant été générés depuis des documents Word par ex.
Dans un tel cas on peut souvent faire un copier coller de la page depuis une sélection dans le pdf vers Word et récupérer ainsi le pdf au format Word.
Il existe un bon nombre de convertisseurs pdf -> Word. Il y en a de performants et d'autres beaucoup moins, parfois partant avec un pdf de 1 MByte, on se retrouve avec un Word de 500 MByte !!! Je n'en connais pas de gratuit que j'ai testé, mais il peut y avoir des versions d'essai durant quelques jours.
Fais une recherche Google en anglais avec:
http://www.google.com/advanced_search?hl=en
ou
https://www.google.com/webhp?hl=en&tab=Xw
et la recherche de:
pdf converter
pdf converter freeware
Ils sont quasiment tous en anglais... :?
Il faudra faire le tri car beaucoup sont dans le sens inverse word -> pdf.
Les pdf sont parfois protégés par un password, cela peut verrouiller diverses manipulations.
J'ai le virus des sciences, ça se soigne ?
gigiair
Utilisateur chevronné
Utilisateur chevronné
Messages : 2834
Inscription : samedi 08 juillet 2006, 20:56
Localisation : Saint Bonnet Elvert

Re: OCR gratuit

Message non lu par gigiair »

dessosos a écrit : je recherche un ocr gratuit pour passer des docs pdf à word..
Passer à Word, ce n'est pas une fin en soi. Résoudre un problème, mathématique ou non, c'est souvent le reformuler.
S'il s'agit d'apporter quelques modifications à une page, n'importe quel éditeur graphique (inkscape par exemple) le fait. Il faut un logiciel pour extraire/recomposer les pages. pdftk par exemple le fait.

On peut aussi vouloir extraire le texte et les images pour recomposer un document entièrement. xpdf fournit les outils pour ça (pdftext, pdfimages).

Il y a un visualisateur qui se prétend «avec OCR intégré» pdfxviewer, je ne sais pas trop comment ça marche, je n'ai pas réussi à le faire fonctionner. Ce qui est fourni est un article d'appel pour un produit commercial plus complet. Peut-être que ça t'intéressera.

libreoffice permet d'ouvrir et d'éditer des documents pdf. Comme je ne le pratique pas, je n'ai pas d'opinion. Sans doute que ça dépend de la façon dont le pdf a été composé.
J'ai une très mauvaise expérience des OCR, j'ai traité un document de plusieurs dizaines de pages, ensuite j'ai passé plus de temps en corrections que je n'en aurait passé à le taper entièrement, il faut voir avec ton document.
JJR.
LaTeXien migrateur.
Framboise
Utilisateur chevronné
Utilisateur chevronné
Messages : 1174
Inscription : lundi 21 mai 2007, 13:57
Statut actuel : Autre
Localisation : Dordogne

Re: OCR gratuit

Message non lu par Framboise »

J'ai une très mauvaise expérience des OCR, j'ai traité un document de plusieurs dizaines de pages, ensuite j'ai passé plus de temps en corrections que je n'en aurait passé à le taper entièrement, il faut voir avec ton document.
+1
Ayant utilisé Omnipage Pro, cela dépend beaucoup de la qualité du document d'origine. Un texte aux caractères "bruités" est vite catastrophique.
Les dernières versions de Omnipage sont nettement plus performantes que les plus anciennes. Des taux d'erreur déjà de quelques % impliquent une révision pénible du résultat final de l'OCR.
J'ai le virus des sciences, ça se soigne ?
dessosos

Re: OCR gratuit

Message non lu par dessosos »

Bonjour,

merci pour toutes vos suggestions. j'ai téléchargé omnipage pro mais je n'arrive pas à l’installer sous windows 7. A l'aide.........
Framboise
Utilisateur chevronné
Utilisateur chevronné
Messages : 1174
Inscription : lundi 21 mai 2007, 13:57
Statut actuel : Autre
Localisation : Dordogne

Re: OCR gratuit

Message non lu par Framboise »

Je suis encore sous XP. :mrgreen:
Je ne vois pas où peut être le problème avec W7.
Possible que ta version téléchargée soit défectueuse, il faudrait tenter de la recharger.
Il s'agit bien de la version 18, la 16 ne semble pas compatible W7 ? La 16 est nettement moins performante, tu pourrais éventuellement la faire tourner en émulation de XP ou Vista sous W7 Ultimate.
J'ai le virus des sciences, ça se soigne ?
dessosos

Re: OCR gratuit

Message non lu par dessosos »

Bonjour,

Toujours à la recherche d'une version de omnipage pro 18. Je tombe sans cesse sur des liens qui ne fonctionnent pas. Auriez-vous un lien qui marche à me conseiller.

Merci d'avance
Arnaud
Modérateur honoraire
Modérateur honoraire
Messages : 7098
Inscription : lundi 28 août 2006, 13:18
Localisation : Allemagne

Re: OCR gratuit

Message non lu par Arnaud »

Probablement ici : http://www.nuance.fr/for-business/by-pr ... /index.htm pour 399€ seulement.
Arnaud
Un peu d'info - Pyromaths - Pas d'aide en MP (non plus)
Framboise
Utilisateur chevronné
Utilisateur chevronné
Messages : 1174
Inscription : lundi 21 mai 2007, 13:57
Statut actuel : Autre
Localisation : Dordogne

Re: OCR gratuit

Message non lu par Framboise »

Nuance Omnipage 18 est payant ou en version d'évaluation gratuite bridée de 15 jours. Si il est complet et gratuit, c'est du piratage illégal et nous ne donnerons pas de lien pour cela.
Je pourrais probablement faire des tests avec Omnipage 18.1 si tu le souhaites. Pour cela, il faudrait que tu transmettes un exemple de ton fichier à convertir ( si pas trop confidentiel... ).
Tu peux le stocker et mettre le lien avec un site confortable tel que:
http://www.mediafire.com/
Tu peux le compresser avec un mot de passe si tu veux que cela reste confidentiel, éventuellement par PM.

Il ne faut pas s'attendre à des miracles s'il y a des mises en page avec des formules mathématiques. Il est efficace essentiellement avec du texte normal, le reste produira probablement des fragments d'images mêlées au texte.
J'ai le virus des sciences, ça se soigne ?
dessosos

Re: OCR gratuit

Message non lu par dessosos »

Merci pour le lien. Cependant je recherche essentiellement une version gratuite. je me demandais s'il existe un équivalent dans la large des logiciels libres.