通用文档识别
产品概述
对图像/PDF页面进行版面解析及结构化内容提取,文档版面划分多个区域,其中文字相关区域提取为文字内容,图像区域提取为图片,表格区域提取为HTML,公式区域提取为LateX格式字符,最终以Markdown格式输出结果报文。



产品特点
多方向图像识别
支持任意角度旋转的图像检测识别。
多语言支持
支持100+种语言的高准确率识别,以及手写体识别等。
支持高并发预测
单卡支持对多路请求的并行响应处理,支持单机多卡以及多机集群化部署,满足高并发场景的识别需求。
支持复杂版面结构化识别
支持对复杂版面的布局检测,包括公式、表格、图像以及段落区块等,并按人类阅读顺序返回识别结果。
标准的服务私有化部署,多操作系统支持
提供标准的高集成度部署包,私有化部署一键轻松搞定,支持在 ( Linux / Window ) 服务器操作系统、包括国产化操作系统上的私有化部署。
