表格识别产线可以指定markdown输出吗 #2750

DietDietDiet · 2024-12-31T09:22:28Z

from paddlex import create_pipeline

pipeline = create_pipeline(pipeline="table_recognition")

output = pipeline.predict("01.png")
for res in output:
res.print() ## 打印预测的结构化输出
res.save_to_img("./output/") ## 保存img格式结果
res.save_to_xlsx("./output/") ## 保存表格格式结果
res.save_to_html("./output/") ## 保存html结果

使用表格识别产线，可以拿到markdown格式的输出结果吗，或者写入excel后可复制的string，便于服务化返回，谢谢！

Bobholamovic · 2024-12-31T13:25:39Z

你好，暂时不支持返回markdown的结果，但许多markdown渲染引擎都支持内嵌HTML，不知道save_to_html保存的HTML结果是否能满足你的需求？实际上，paddlex官方提供的服务化部署方案中，表格识别产线的服务也是会返回html string的。

DietDietDiet · 2025-01-02T12:17:43Z

请问一下这个output的结构是怎样的啊，是表格的结果都在table_result这个key里面吗，里面是个列表的原因是为了兼容多张图片输入还是一张图片里有多个表格呢

Bobholamovic · 2025-01-02T14:01:01Z

pipeline.predict本身返回一个迭代器，迭代器中元素的数量和输入图片数量相同，每个元素中包含对应图片中的多个表格。

DietDietDiet · 2025-01-03T03:19:45Z

get~ 感谢！最后想请教下现在table_recognition默认的配置已经是识别效果最准的了吗，还有没有慢一些但是更准的配置呢~

Bobholamovic · 2025-01-03T03:33:30Z

在这里可以找到各模型的速度和精度数据：
https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta2/docs/pipeline_usage/tutorials/ocr_pipelines/table_recognition.md

TingquanGao assigned Bobholamovic Dec 31, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

表格识别产线可以指定markdown输出吗 #2750

表格识别产线可以指定markdown输出吗 #2750

DietDietDiet commented Dec 31, 2024

Bobholamovic commented Dec 31, 2024

DietDietDiet commented Jan 2, 2025

Bobholamovic commented Jan 2, 2025

DietDietDiet commented Jan 3, 2025

Bobholamovic commented Jan 3, 2025

表格识别产线可以指定markdown输出吗 #2750

表格识别产线可以指定markdown输出吗 #2750

Comments

DietDietDiet commented Dec 31, 2024

Bobholamovic commented Dec 31, 2024

DietDietDiet commented Jan 2, 2025

Bobholamovic commented Jan 2, 2025

DietDietDiet commented Jan 3, 2025

Bobholamovic commented Jan 3, 2025