目前使用 Mistral 进行 OCR 会默认得到包含页眉页脚的结果,影响美观,也会造成翻译额度的浪费。根据当前官方 API 文档说明,排除页眉页脚是可能的:
const ocrResponse = await client.ocr.process({
model: "mistral-ocr-latest",
document: {
type: "document_url",
documentUrl: signedUrl.url,
},
tableFormat: "html", // default is "markdown"
// extractHeader: False, // default is False
// extractFooter: False, // default is False
includeImageBase64: true
});
希望可以考虑提供这样一个选项。
目前使用 Mistral 进行 OCR 会默认得到包含页眉页脚的结果,影响美观,也会造成翻译额度的浪费。根据当前官方 API 文档说明,排除页眉页脚是可能的:
希望可以考虑提供这样一个选项。