c# - Localisation du texte dans l'image

Translate

Je travaille actuellement sur un projet et mon objectif est de localiser du texte dans une image. Mon intention n'est pas pour le moment d'OCR du texte. Je veux essentiellement obtenir les limites du texte dans une image. J'utilise le composant d'imagerie AForge.Net pour la manipulation. Une aide dans un sens ou dans un autre?

Mise à jour du 05/02/09: Depuis, j'ai emprunté une autre voie dans mon projet. Cependant, j'ai essayé d'obtenir du texte en utilisant MODI (Microsoft Office Document Imaging). Il vous permet de faire l'OCR d'une image et d'en extraire du texte avec une certaine facilité.

This question and all comments follow the "Attribution Required."

Toutes les réponses

Translate

C'est un domaine de recherche actif. Il existe littéralement une multitude d'articles universitaires sur le sujet. Il sera difficile de vous aider, surtout sans plus de détails. Recherchez-vous des types de texte spécifiques? Polices? Que l'anglais? Connaissez-vous la littérature académique?

La "détection de texte" est un problème standard dans tout système OCR (reconnaissance optique de caractères) et par conséquent, il y a beaucoup de bits de code sur les interwebs qui le traitent.

Je pourrais commencer à lister des tas de liens de google mais je vous suggère de faire une recherche sur "détection de texte" et de commencer à lire :). De nombreux exemples de code sont également disponibles.

La source
Translate

la reconnaissance du texte à l'intérieur d'une image est en effet un sujet brûlant pour les chercheurs dans ce domaine, mais n'a commencé à devenir incontrôlable que lorsquecaptchaest devenu la «norme» en termes de défense contre les robots spammeurs. Pourquoi utiliser les captcha comme protection? bien parce qu'il est / était très difficile de localiser (et de lire) du texte à l'intérieur d'une image!

La raison pour laquelle je mentionne le captcha est que la plupart des progrès * se font dans cette petite zone, et je pense que votre solution pourrait être mieux trouvée là-bas. surtout parce que les captcha consistent en effet à localiser du texte (ou quelque chose qui ressemble à du texte) à l'intérieur d'une image encombrée et ensuite à essayer de lire correctement les lettres.

alors si tu peux te trouverun bon outil de rupture de captcha open sourcevous avez probablement tout ce dont vous avez besoin pour continuer votre quête ...
Vous pourriez probablement même jeter le code le plus difficile qui gère la reconnaissance de caractères elle-même, car ces OCR sont utilisés pour lire du texte déformé, ce que vous n'avez pas à faire.

*: avancement en termes de visible, utilisable etpratiqueinformation pour un "non-chercheur"

La source
Translate

Si vous êtes d'accord avec l'utilisation d'une API en ligne pour cela, l'API àhttp://www.wisetrend.com/wisetrend_ocr_cloud.shtmlpeut faire la détection de texte en plus de l'OCR uniquement.

La source
Translate

Transformation de largeur de traitpeut le faire pour vous. C'est du moins ce que MS a développé pour le système d'exploitation de leur téléphone mobile. Une discussion sur la mise en œuvre estici à https://stackoverflow.com/

La source
précédent:
c# - Agiter la souris