OCR gratuit
OCR gratuit
bonjour,
je recherche un ocr gratuit pour passer des docs pdf à word..
Merci pour vos suggestions
je recherche un ocr gratuit pour passer des docs pdf à word..
Merci pour vos suggestions
-
- Utilisateur chevronné
- Messages : 2656
- Inscription : dimanche 28 février 2010, 11:54
- Localisation : Région Lyonnaise
Re: OCR gratuit
"L'ignorance n'est pas ne pas connaître, c'est ne pas vouloir connaître."
Une ch'tio peu d'pub :Ina-Ich
Ubuntu | LibreOffice | GnuPlot | PidGin | irssi | Mozilla | VLC ...
Une ch'tio peu d'pub :Ina-Ich
Ubuntu | LibreOffice | GnuPlot | PidGin | irssi | Mozilla | VLC ...
-
- Utilisateur chevronné
- Messages : 1174
- Inscription : lundi 21 mai 2007, 13:57
- Statut actuel : Autre
- Localisation : Dordogne
Re: OCR gratuit
Bonjour,
Si les pdf sont des images, il faut passer par un OCR comme tu l'envisages.
Acrobat ( pas Acrobat Reader ! ) a une telle fonction d'OCR, mais pas gratuit...
Cependant, les pdf sont très souvent du texte avec mise en forme ayant été générés depuis des documents Word par ex.
Dans un tel cas on peut souvent faire un copier coller de la page depuis une sélection dans le pdf vers Word et récupérer ainsi le pdf au format Word.
Il existe un bon nombre de convertisseurs pdf -> Word. Il y en a de performants et d'autres beaucoup moins, parfois partant avec un pdf de 1 MByte, on se retrouve avec un Word de 500 MByte !!! Je n'en connais pas de gratuit que j'ai testé, mais il peut y avoir des versions d'essai durant quelques jours.
Fais une recherche Google en anglais avec:
http://www.google.com/advanced_search?hl=en
ou
https://www.google.com/webhp?hl=en&tab=Xw
et la recherche de:
pdf converter
pdf converter freeware
Ils sont quasiment tous en anglais...
Il faudra faire le tri car beaucoup sont dans le sens inverse word -> pdf.
Les pdf sont parfois protégés par un password, cela peut verrouiller diverses manipulations.
Si les pdf sont des images, il faut passer par un OCR comme tu l'envisages.
Acrobat ( pas Acrobat Reader ! ) a une telle fonction d'OCR, mais pas gratuit...
Cependant, les pdf sont très souvent du texte avec mise en forme ayant été générés depuis des documents Word par ex.
Dans un tel cas on peut souvent faire un copier coller de la page depuis une sélection dans le pdf vers Word et récupérer ainsi le pdf au format Word.
Il existe un bon nombre de convertisseurs pdf -> Word. Il y en a de performants et d'autres beaucoup moins, parfois partant avec un pdf de 1 MByte, on se retrouve avec un Word de 500 MByte !!! Je n'en connais pas de gratuit que j'ai testé, mais il peut y avoir des versions d'essai durant quelques jours.
Fais une recherche Google en anglais avec:
http://www.google.com/advanced_search?hl=en
ou
https://www.google.com/webhp?hl=en&tab=Xw
et la recherche de:
pdf converter
pdf converter freeware
Ils sont quasiment tous en anglais...

Il faudra faire le tri car beaucoup sont dans le sens inverse word -> pdf.
Les pdf sont parfois protégés par un password, cela peut verrouiller diverses manipulations.
J'ai le virus des sciences, ça se soigne ?
-
- Utilisateur chevronné
- Messages : 2834
- Inscription : samedi 08 juillet 2006, 20:56
- Localisation : Saint Bonnet Elvert
Re: OCR gratuit
Passer à Word, ce n'est pas une fin en soi. Résoudre un problème, mathématique ou non, c'est souvent le reformuler.dessosos a écrit : je recherche un ocr gratuit pour passer des docs pdf à word..
S'il s'agit d'apporter quelques modifications à une page, n'importe quel éditeur graphique (inkscape par exemple) le fait. Il faut un logiciel pour extraire/recomposer les pages. pdftk par exemple le fait.
On peut aussi vouloir extraire le texte et les images pour recomposer un document entièrement. xpdf fournit les outils pour ça (pdftext, pdfimages).
Il y a un visualisateur qui se prétend «avec OCR intégré» pdfxviewer, je ne sais pas trop comment ça marche, je n'ai pas réussi à le faire fonctionner. Ce qui est fourni est un article d'appel pour un produit commercial plus complet. Peut-être que ça t'intéressera.
libreoffice permet d'ouvrir et d'éditer des documents pdf. Comme je ne le pratique pas, je n'ai pas d'opinion. Sans doute que ça dépend de la façon dont le pdf a été composé.
J'ai une très mauvaise expérience des OCR, j'ai traité un document de plusieurs dizaines de pages, ensuite j'ai passé plus de temps en corrections que je n'en aurait passé à le taper entièrement, il faut voir avec ton document.
JJR.
LaTeXien migrateur.
LaTeXien migrateur.
-
- Utilisateur chevronné
- Messages : 1174
- Inscription : lundi 21 mai 2007, 13:57
- Statut actuel : Autre
- Localisation : Dordogne
Re: OCR gratuit
+1J'ai une très mauvaise expérience des OCR, j'ai traité un document de plusieurs dizaines de pages, ensuite j'ai passé plus de temps en corrections que je n'en aurait passé à le taper entièrement, il faut voir avec ton document.
Ayant utilisé Omnipage Pro, cela dépend beaucoup de la qualité du document d'origine. Un texte aux caractères "bruités" est vite catastrophique.
Les dernières versions de Omnipage sont nettement plus performantes que les plus anciennes. Des taux d'erreur déjà de quelques % impliquent une révision pénible du résultat final de l'OCR.
J'ai le virus des sciences, ça se soigne ?
Re: OCR gratuit
Bonjour,
merci pour toutes vos suggestions. j'ai téléchargé omnipage pro mais je n'arrive pas à l’installer sous windows 7. A l'aide.........
merci pour toutes vos suggestions. j'ai téléchargé omnipage pro mais je n'arrive pas à l’installer sous windows 7. A l'aide.........
-
- Utilisateur chevronné
- Messages : 1174
- Inscription : lundi 21 mai 2007, 13:57
- Statut actuel : Autre
- Localisation : Dordogne
Re: OCR gratuit
Je suis encore sous XP.
Je ne vois pas où peut être le problème avec W7.
Possible que ta version téléchargée soit défectueuse, il faudrait tenter de la recharger.
Il s'agit bien de la version 18, la 16 ne semble pas compatible W7 ? La 16 est nettement moins performante, tu pourrais éventuellement la faire tourner en émulation de XP ou Vista sous W7 Ultimate.

Je ne vois pas où peut être le problème avec W7.
Possible que ta version téléchargée soit défectueuse, il faudrait tenter de la recharger.
Il s'agit bien de la version 18, la 16 ne semble pas compatible W7 ? La 16 est nettement moins performante, tu pourrais éventuellement la faire tourner en émulation de XP ou Vista sous W7 Ultimate.
J'ai le virus des sciences, ça se soigne ?
Re: OCR gratuit
Bonjour,
Toujours à la recherche d'une version de omnipage pro 18. Je tombe sans cesse sur des liens qui ne fonctionnent pas. Auriez-vous un lien qui marche à me conseiller.
Merci d'avance
Toujours à la recherche d'une version de omnipage pro 18. Je tombe sans cesse sur des liens qui ne fonctionnent pas. Auriez-vous un lien qui marche à me conseiller.
Merci d'avance
-
- Modérateur honoraire
- Messages : 7098
- Inscription : lundi 28 août 2006, 13:18
- Localisation : Allemagne
Re: OCR gratuit
Probablement ici : http://www.nuance.fr/for-business/by-pr ... /index.htm pour 399€ seulement.
-
- Utilisateur chevronné
- Messages : 1174
- Inscription : lundi 21 mai 2007, 13:57
- Statut actuel : Autre
- Localisation : Dordogne
Re: OCR gratuit
Nuance Omnipage 18 est payant ou en version d'évaluation gratuite bridée de 15 jours. Si il est complet et gratuit, c'est du piratage illégal et nous ne donnerons pas de lien pour cela.
Je pourrais probablement faire des tests avec Omnipage 18.1 si tu le souhaites. Pour cela, il faudrait que tu transmettes un exemple de ton fichier à convertir ( si pas trop confidentiel... ).
Tu peux le stocker et mettre le lien avec un site confortable tel que:
http://www.mediafire.com/
Tu peux le compresser avec un mot de passe si tu veux que cela reste confidentiel, éventuellement par PM.
Il ne faut pas s'attendre à des miracles s'il y a des mises en page avec des formules mathématiques. Il est efficace essentiellement avec du texte normal, le reste produira probablement des fragments d'images mêlées au texte.
Je pourrais probablement faire des tests avec Omnipage 18.1 si tu le souhaites. Pour cela, il faudrait que tu transmettes un exemple de ton fichier à convertir ( si pas trop confidentiel... ).
Tu peux le stocker et mettre le lien avec un site confortable tel que:
http://www.mediafire.com/
Tu peux le compresser avec un mot de passe si tu veux que cela reste confidentiel, éventuellement par PM.
Il ne faut pas s'attendre à des miracles s'il y a des mises en page avec des formules mathématiques. Il est efficace essentiellement avec du texte normal, le reste produira probablement des fragments d'images mêlées au texte.
J'ai le virus des sciences, ça se soigne ?
Re: OCR gratuit
Merci pour le lien. Cependant je recherche essentiellement une version gratuite. je me demandais s'il existe un équivalent dans la large des logiciels libres.