【TextIn:开源免费的AI智能文字识别产品(通用文档智能解析识别、OCR识别 ...

打印 上一主题 下一主题

主题 668|帖子 668|积分 2004

TextIn:开源免费的AI智能文字识别产品(通用文档智能解析识别、OCR识别、文档格式转换、篡改检测、证件识别等)

产品的官网:TextIn官网
盼望感兴趣以及有需求的小伙伴们多多了解,因为这篇文章也是源于管网先容才产出的,是智能文档处理的“百宝箱”,提升各人文档处理类工作效率,无论是工作中、学习中还是生活中,盼望能成为各人高效的文档处理和识别的小助手!!!
首次官网注册使用享有免费福利哦
   【产品福利】
100次通用文档解析
100次通用文字识别
100次智能文档抽取
  以下是结合AI大模子实现的当下热门产品,为用户提供智能图像处理、文字表格识别、文档内容提取,保单票据智能抽取,通用文档解析百页pdf仅需2s,快来体验吧!
体验入口

文档解析:
https://cc.co/16YSLE
智能文档抽取:
https://cc.co/16YSLF
一、简介

TextIn是合合信息旗下智能文字识别产品,拥有智能文字识别技术和企业服务经验,产品提供公有云API、私有化摆设、端侧SDK、AIoT(支持硬件设备集成,扫描仪、扫描笔等)多种摆设方式,可查看详细的API文档:API文档。致力于为企业、开发者及个人用户提供一站式智能文字识别服务。TextIn智能文字识别引擎可以从图像和PDF文档中提取印刷、手写、印章、公式、表格、图片等富文本信息,支持50+多语言识别,众多文档类型,包括贸易文件、发票、账单、收据、名片和海报。在财务共享体系中可以从混贴的发票中切分、分类、提取字段信息,支持发票中错行、倾斜、重叠、遮挡、形变、光照不均等复杂场景;在证件识别体系中支持13类国家证件识别,覆盖个人和企业所需的200+种证件识别;在人机结合体系中实现精准100%识别,远逾越人类的辨识度;支持华为云、阿里云、腾讯云、百度云、Azure、AWS等云平台摆设,同时支持GPU、CPU、NPU、iOS、Android、HarmonyOS、鲲鹏、飞腾、麒麟等重要国表里平台;TextIn识别引擎在通用场景中平均1s处理完一张文本图像。
总结就是:TextIn是合合信息公司旗下结合AI最新最高效的文字识别产品服务一站式平台,无论是企业、用户、还是开发者都可以使用,支持API请求访问、在线平台测试、私有化摆设等,我个人用的比较多的场景还是文档解析、文档格式转换等、OCR票据识别等。公司我就不先容了,旗下以下产品肯定有使用过的小伙伴吧。

二、背景

智能文字识别(OCR,Optical Character Recognition)技术通过将图像中的文字信息转换为可编辑的数字文本,资助用户提高工作效率。随着深度学习和盘算机视觉技术的快速发展,OCR 技术的正确性和应用范围不绝提升。企业盼望通过自动化工具减少人力成本,提高数据处理的速率和正确性,从而加速业务决策。现在,市场上已经出现了多种OCR解决方案,覆盖了从基础的文字识别到复杂的文档处理使命。这些解决方案通常依赖于深度学习模子来提升识别精度,实用于不同类型的文档,包括票据、合同、名片等。
然而,很多现有的OCR产品在现实应用中仍面临一些挑战,例如:

  • 正确率不敷:对于复杂排版或低质量图像,识别精度可能受到影响。
  • 多场景支持不敷:很多产品只能实用于特定场景,缺乏机动性。
  • 摆设方式单一:传统产品往往局限于云端或本地摆设,缺乏多样化选择。
TextIn的优势

TextIn以其高精准度和多场景化的产品计划,针对在私有范畴的知识问答和企业知识管理范畴,使用检索加强型天生模子(Retrieval-Augmented Generation, RAG)大模子(Large Language Model, LLM)已成为一种趋势,但是在RAG的文档预处理和检索阶段会出现由于解析精度不敷导致LLM回答专业知识范畴并不高效正确,公司自主研发的向量表征模子-acge_text_embedding,针对当前市场的痛点提供了有效解决方案。具体优势包括:


  • 高精准度识别引擎:TextIn采用先进的深度学习技术,经过大量真实场景的数据练习,确保在各种文档类型下均能实现高正确率。
  • 多种摆设方式:支持云端、边沿和本地摆设,满意不同用户的需求,无论是大企业还是中小型组织都可以根据自身环境选择最合适的摆设方式。
  • 场景化产品计划:针对不同的业务场景,TextIn提供了定制化的解决方案,例如发票处理、合同扫描、证件识别等,大幅提升文档处理的效率。
对上述自研技术感兴趣的小伙伴可以访问【文档智能 & RAG】RAG新基建-RAG性能加强关键技术点及通用文档解析工具和开源Embedding模子,有效提升中文语义明确与召回,相信会给研究RAG的小伙伴带来启发!
三、文档解析

直接通过上面的链接进入,如下所示,填写手机号注册即可体验。

下面是通用文档解析的工作台界面,左边是一个可缩进的菜单,内里有“临时文件”的功能开关按钮,这里可以鼠标光标移动到“临时文件”旁边的圆形感叹号图标查看功能分析。
省流版本:TextIn(在线工作台)默认不存储您上传的任何文件,关闭大概革新页面会清空文件列表,左下面的上传文件按钮也是可以点击上传文件的。

这里我们开启开关查看相关功能和分析,临时文件——>我的文件,但是文件数目过多,默认只保留最近30天的文件。上传文件支持的格式有:png、jpg、jpeg、pdf、bmp、tiff、webp、doc、docx、html、mhtml,单个文件巨细不凌驾500MB

这里我们可以点击中心灰色地区任何地方大概拖拽文件到上面灰色地区即可,左上角另有“API文档、私有化摆设、消耗次数0/100”的功能显示。左上角有一个“示例样本”,我们可以点击看看

这是一个包含了“13页的本科结业论文排版格式文档”,我们可以清晰的对比左边是pdf格式原始文档和右边转换的markdown结果,原始文档中的表格、公式、图片、手写、原始JSON都会被智能解析出来,我们可以点击想要查看的内容,这里就不一一展示了哈。(tips:左边另有一个目次看到没?点击目次的多级标题中任意标题,中心的原始文档和右边转换的markdown结果会直接定义到你点击的标题内容版面中去,方便你检查文档解析的结果,超级直观好用!!!
接下来我们看看这个样例文本解析后的markdown结果右下角“编辑、高级模式、复制结果、导出结果”四个功能。
编辑:顾名思义就是可以在右侧的markdown结果中在线编辑内里的内容。内里的图片、公式都可以编辑修改,都是markdown语法的方式哦,不熟悉该格式的可以查看markdown教程简单学习下哈!
**高级模式:**内里有pdf密码、文件分辨率、解析起点页码、解析页数、识别标题、等多个参数设置,方便对文档解析有定向要求的用户使用,解码模子支持auto和scan方式,等待小伙伴自行实验,这里就不一一展示了。

**复制结果:**就是复制markdown内里的结果。
**导出结果:**支持将解析后的文字导出保存,导出格式重要是md和txt格式,如果想要导出指定公式、图片等,可选择性的导出。记得在markdown内里显示,必要加在行内显示公式,使用单个美元符号;公式单独占一行,可以使用双美元符号。下面演示其中的公式
                                                    1                                                        2                                     π                                                                        ∫                               R                                                 e                                           −                                                             x                                        2                                                  2                                                             =                            1                            。                                  \frac { 1 } { \sqrt { 2 \pi } } \int _ { R } e ^ { - \frac { x ^ { 2 } } { 2 } } = 1 。                     2π                    ​1​∫R​e−2x2​=1。

导出成md格式文件,展示结果如下:

这里我上传一篇OpenAI官网的《OpenAI ol System Card》的核心技术文档,个人体验感觉识别的很精准,识别速率很快,我这里识别了文档前20页。

这是上传前面一张md文档截图的识别结果:

小小总结:真的识别速率又快有准,小伙伴有其他格式的可以自行体验!
四、智能文档抽取

老例子,体验入口还是我放在了简介前面了,这里你进入在线体验的,时候,会有新手引导,建议第一次使用的人可以看看详细的官方功能先容。

这里还是先简单先容下工作台面板,左边就是几个必要抽取内容的示例图片,中心就是必要文档抽取的文件,必要上传,右边是抽取的结果展示。

这里先随便使用一张示例图片来测试下结果(原始抽取字段):

下面是我添加几个字段后的识别内容:

接下来我会添加一张自己准备的电子保单的jpg图片,看看智能文档抽取的结果

这是导出结果的文件展示

这谁JSON显示的结果

这里我采用我们TextIn的宣传海报截取部分带有表格的海报用来识别,结果如下:

购物小票的识别,这里简单分析下,因为这个图片是样例小票,小票内容文本字段和默认字段并没有“付出金额”等明确字段名表现,但是还是可以或许识别出我想要表达的字段信息,还是比较优秀的,根据官网的分析,这里就是使用了依托于垂直范畴的语义模子,就是结合了大模子去做的语义明确和高质量的基础数据预料作为模子的通识本领。

小小总结:识别的是真的快,抽取的字段又很正确!
总结

TextIn是真的挺好用的,上面内容展示了文档解析和智能文档抽取,另有更多更好玩的OCR识别等你们体验,现在合合信息团队也将TextIn ParseX 项目开源了,不仅仅可以在线使用他们的服务,我们也可以本地摆设该服务,这个再提供他们开源的github仓库地址:Parsex-Frontend,这里如果本地摆设实践是必要我们去TextIn工作台申请API的,必要得到x-ti-app-idx-ti-secret-code两个密钥在打开本地项目-高级设置内里去填写这两个密钥就可以使用了,详细的项目结构就不先容了,小伙伴可以自行去研究,以上内容是在在线平台上操作使用的,详细可以去TextIn工作台去体验,内里API文档支持在线调试功能等,盼望小伙伴们多多分享使用经验,有任何疑问可以直接联系他们官网的客服人员反馈。
如需了解更多文档处理权益,欢迎点击下方链接,到场交流社群,随时获得最新资讯及福利。
百宝箱大礼包

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

民工心事

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表