[功能]: 指定视觉模型为文本模型提供OCR能力 #2396

mkraku · 2025-01-01T12:27:09Z

mkraku
Jan 1, 2025

您的功能建议是否与某个问题相关?

否

请描述您希望实现的解决方案

参考deepseek官网，他们应该是有一个专门的OCR模型，可以提取图片和扫描版的文档的文字作为上下文发起提问
想要在默认模型中增加一个“视觉模型”，为无视觉能力的AI提供图片和文档对话的可能。
硅基流动有便宜的视觉模型，智谱也有免费的视觉模型，用来做ocr足够了。

请描述您考虑过的其他方案

No response

其他补充信息

No response

TaoCaptain · 2025-02-13T21:45:46Z

TaoCaptain
Feb 13, 2025

很想试试做这个功能，不知道难度如何

0 replies

ChenYangBin666 · 2025-10-20T07:19:58Z

ChenYangBin666
Oct 20, 2025

非常支持，用了半年cherry studio觉得最麻烦的就是这个了，得手动丢给OCR识别，有时候嫌麻烦甚至单独打开deepseek网页版用

0 replies

mamaruo · 2025-10-24T04:21:52Z

mamaruo
Oct 24, 2025

现在有系统OCR支持。但是我没找到怎么用到非视觉模型的输入当中。

0 replies

Here-Tim2354 · 2025-10-31T04:52:59Z

Here-Tim2354
Oct 31, 2025

我也非常需要这个，以支持许多国产的非多模态模型

0 replies

ChenYangBin666 · 2025-11-02T03:25:20Z

ChenYangBin666
Nov 2, 2025

目前用cherry感到最不方便的就是这个了，别的都非常好

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[功能]: 指定视觉模型为文本模型提供OCR能力 #2396

Uh oh!

{{title}}

Uh oh!

Replies: 5 comments

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Uh oh!

{{title}}

Uh oh!

Select a reply

Uh oh!

[功能]: 指定视觉模型为文本模型提供OCR能力 #2396

Uh oh!

mkraku Jan 1, 2025

您的功能建议是否与某个问题相关?

请描述您希望实现的解决方案

请描述您考虑过的其他方案

其他补充信息

Replies: 5 comments

Uh oh!

TaoCaptain Feb 13, 2025

Uh oh!

ChenYangBin666 Oct 20, 2025

Uh oh!

mamaruo Oct 24, 2025

Uh oh!

Here-Tim2354 Oct 31, 2025

Uh oh!

ChenYangBin666 Nov 2, 2025

mkraku
Jan 1, 2025

TaoCaptain
Feb 13, 2025

ChenYangBin666
Oct 20, 2025

mamaruo
Oct 24, 2025

Here-Tim2354
Oct 31, 2025

ChenYangBin666
Nov 2, 2025