流式返回为何还是接口相应完一次性返回 #32

chenwenniupi · 2025-01-08T09:37:12Z

No description provided.

LnYo-Cly · 2025-01-08T14:06:00Z

请问是否有详细的描述，例如问题截图、环境、依赖版本、测试代码等等。

chenwenniupi · 2025-01-09T03:14:01Z

目前流式返回速度很慢调用之后都是接口响应完成之后再一次性返回

chenwenniupi · 2025-01-09T03:14:41Z

LnYo-Cly · 2025-01-09T03:26:59Z

回复速度慢是因为ollama
前端在流式下一次性或大段内容输出打印，你可以在send函数中添加Thread.sleep(10);

chenwenniupi · 2025-01-09T03:34:58Z

现在的流式响应是接口调用一般要等20几秒才开始返回我的理解是应该是流式返回总共花20多秒

LnYo-Cly · 2025-01-09T09:20:03Z

现在的流式响应是接口调用一般要等20几秒才开始返回我的理解是应该是流式返回总共花20多秒

请使用参数量更小的模型
升级你的计算机配置
使用GPU加载ollama
ollama的模型第一次使用会进行预加载，你可以设置参数修改模型保活时间

LnYo-Cly · 2025-01-09T09:28:49Z

现在的流式响应是接口调用一般要等20几秒才开始返回我的理解是应该是流式返回总共花20多秒

上图测试也为llama3.2:1b模型

返回时间慢，和框架无关

chenwenniupi · 2025-01-10T06:09:56Z

请问你这个ollama是在什么配置的电脑或者服务器上跑的呢？

MaLoneGitHub · 2025-02-12T07:38:33Z

同样的问题，stream，请求几十秒之后，一下全部打印了。但是用其他SDK（PlexPt/chatgpt-java）的就是一段一段打印的。地址参数都是一摸一样

LnYo-Cly · 2025-02-13T18:31:35Z

同样的问题，stream，请求几十秒之后，一下全部打印了。但是用其他SDK（PlexPt/chatgpt-java）的就是一段一段打印的。地址参数都是一摸一样

你好，我使用你提到的SDK，二者效果是一样的。

图一是我自己部署的线上环境测试。

图二是我使用您所提到的SDK的测试。

二者均是流式逐字打印。

LnYo-Cly added a commit that referenced this issue Feb 14, 2025

#31 #32 #36 fix: 修复因ErrorInterceptor而导致部分平台的流式输出失效问题

b609c97

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

流式返回为何还是接口相应完一次性返回 #32

流式返回为何还是接口相应完一次性返回 #32

chenwenniupi commented Jan 8, 2025

LnYo-Cly commented Jan 8, 2025

chenwenniupi commented Jan 9, 2025

chenwenniupi commented Jan 9, 2025

LnYo-Cly commented Jan 9, 2025

chenwenniupi commented Jan 9, 2025

LnYo-Cly commented Jan 9, 2025

LnYo-Cly commented Jan 9, 2025 •

edited

Loading

chenwenniupi commented Jan 10, 2025

MaLoneGitHub commented Feb 12, 2025

LnYo-Cly commented Feb 13, 2025

流式返回为何还是接口相应完一次性返回 #32

流式返回为何还是接口相应完一次性返回 #32

Comments

chenwenniupi commented Jan 8, 2025

LnYo-Cly commented Jan 8, 2025

chenwenniupi commented Jan 9, 2025

chenwenniupi commented Jan 9, 2025

LnYo-Cly commented Jan 9, 2025

chenwenniupi commented Jan 9, 2025

LnYo-Cly commented Jan 9, 2025

LnYo-Cly commented Jan 9, 2025 • edited Loading

chenwenniupi commented Jan 10, 2025

MaLoneGitHub commented Feb 12, 2025

LnYo-Cly commented Feb 13, 2025

LnYo-Cly commented Jan 9, 2025 •

edited

Loading