[BUG] 提取信息大小写错误 #103

jinghong-6 · 2024-02-04T16:32:35Z

在进行信息提取时，有一条信息的英文字母应该是大写，但是得出的结果只有首字母大写，多尝试了几次最多就前两个字母是大写的

源文件是word
可能是识别成单词了，不知道如何解决

- OS:Ubuntu 23.10
- NVIDIA Driver:
- CUDA:
- Docker Compose:
- NVIDIA GPU Memory:16GB

No response

No response

No response

jinghong-6 · 2024-02-04T16:51:56Z

过了一会又可以了，我看了数据来源的数据预览，确实是SOB三个大写字母
大写变小写这是大模型私自处理的吧，还有就是
后面把O识别成0了
这问题应该怎么解决呢

jinghong-6 · 2024-02-04T17:01:15Z

目前的模型是7b，之前使用ChatGLM3-6B+langchain-chatchat并不会出现这种情况，用word的话再怎么胡说八道也不至于把源内容给改了，还有就是能否自主选择LLM或者Embedding，增加更多的适配

Provide feedback