c# -在图像中定位文本

Translate

我目前正在从事一个项目,我的目标是在图像中定位文本。到目前为止,OCR'ing文本并不是我的意图。我想基本上获取图像内文本的边界。我正在使用AForge.Net成像组件进行操作。在某种意义上有任何帮助吗?

更新2/5/09:此后,我在项目中走了另一条路。但是,我确实尝试使用MODI(Microsoft Office Document Imaging)获取文本。它使您可以轻松地对图像进行OCR,并从中提取文本。

This question and all comments follow the "Attribution Required."

所有的回答

Translate

这是一个活跃的研究领域。从字面上看,有关这一主题的学术论文十分丰富。如果没有更多细节,将很难为您提供帮助。您在寻找特定类型的文字吗?字体?仅限英语?您熟悉学术文献吗?

在任何OCR(光学字符识别)系统中,“文本检测”都是一个标准问题,因此,在互连网上有很多处理它的代码。

我可以开始列出来自Google的大量链接,但我建议您只是搜索“文本检测”并开始阅读:)。也有足够的示例代码。

来源
Translate

识别图像中的文本确实是该领域研究人员的热门话题,但是直到验证码成为抵御垃圾邮件机器人的“常态”。为什么要使用验证码作为保护?很好,因为很难(很难)定位(读取)图像中的文本!

我提到验证码的原因是,最大的进步是在这个很小的区域内完成的,我认为您的解决方案最好在那儿找到。特别是因为验证码确实是关于在混乱的图像中定位文本(或类似文本的东西),然后尝试正确读取字母。

所以如果你能找到自己一个好的开源验证码破解工具您可能拥有继续完成任务所需的一切...
您甚至可能会丢弃处理字符识别本身的最困难的代码,因为这些OCR用于读取变形的文本,而您不必这样做。

*:在可见度,可用度和实际的供“非研究人员”使用的信息

来源
Translate

如果可以使用在线API,请访问以下网址的API:http://www.wisetrend.com/wisetrend_ocr_cloud.shtml除了OCR之外,还可以进行文本检测。

来源
Translate

笔划宽度变换可以为您做到。至少这是MS为他们的手机操作系统开发的。关于实现的讨论是在这里https://stackoverflow.com/

来源
上一个问题:
c# -摆动鼠标