Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

成功在小米10s上运行,但推理速度太慢了。 #2

Open
wangyi152 opened this issue Mar 16, 2024 · 6 comments
Open

成功在小米10s上运行,但推理速度太慢了。 #2

wangyi152 opened this issue Mar 16, 2024 · 6 comments

Comments

@wangyi152
Copy link

成功在小米10s上运行了项目,但推理速度太慢了。
c5f58ce8a95a9569320210410d7deefb

53ecc46cbd9d4823790d5bd9ea0edd74
@ben0oil1
Copy link
Owner

因为是纯粹的CPU推理,算力有限。

这个项目初衷是脱离源项目,方便部署模型的,手机上纯粹是玩耍的,实际意义不大😄

@lmpker
Copy link

lmpker commented Apr 3, 2024

因为纯粹是CPU的推理,算力有限。

这个项目初衷是疏源项目,方便部署模型的,手机上纯粹是重型的,实际意义不大😄

卧槽,这才是我想要的项目。不是谁都有4090,在线训练倒是没什么问题,关键在本地推理,流程要简化且稳定。
炼丹出了问题,大不了重来,也就搭上点时间和少量的成本。本地推理可千万不能再出各种幺蛾子,必须要稳定、简洁。
不能说折腾成本比使用成本都高,那就太划不来了。
你说CPU推理,那我就不困了,毕竟A卡也是有用户的,不能说我想试试效果还要临时再去搞一张N卡来,这么折腾门槛略高。
老哥有时间,可以优化优化项目,真的有人需要(不止我一个),看B站GPT-SoVITS视频的评论区的各种问题就知道。

@ben0oil1
Copy link
Owner

ben0oil1 commented Apr 5, 2024

因为纯粹是CPU的推理,算力有限。
这个项目初衷是疏源项目,方便部署模型的,手机上纯粹是重型的,实际意义不大😄

卧槽,这才是我想要的项目。不是谁都有4090,在线训练倒是没什么问题,关键在本地推理,流程要简化且稳定。 炼丹出了问题,大不了重来,也就搭上点时间和少量的成本。本地推理可千万不能再出各种幺蛾子,必须要稳定、简洁。 不能说折腾成本比使用成本都高,那就太划不来了。 你说CPU推理,那我就不困了,毕竟A卡也是有用户的,不能说我想试试效果还要临时再去搞一张N卡来,这么折腾门槛略高。 老哥有时间,可以优化优化项目,真的有人需要(不止我一个),看B站GPT-SoVITS视频的评论区的各种问题就知道。

@你说的非常有道理,其实跟我的需求是一模一样的,就是腰椎间盘突出电脑前坐不住,有空还会继续推进项目的。

@ZhangJianBeiJing
Copy link

mark

@bigursa
Copy link

bigursa commented Jul 8, 2024

因为纯粹是CPU的推理,算力有限。
这个项目初衷是疏源项目,方便部署模型的,手机上纯粹是重型的,实际意义不大😄

卧槽,这才是我想要的项目。不是谁都有4090,在线训练倒是没什么问题,关键在本地推理,流程要简化且稳定。 炼丹出了问题,大不了重来,也就搭上点时间和少量的成本。本地推理可千万不能再出各种幺蛾子,必须要稳定、简洁。 不能说折腾成本比使用成本都高,那就太划不来了。 你说CPU推理,那我就不困了,毕竟A卡也是有用户的,不能说我想试试效果还要临时再去搞一张N卡来,这么折腾门槛略高。 老哥有时间,可以优化优化项目,真的有人需要(不止我一个),看B站GPT-SoVITS视频的评论区的各种问题就知道。

@你说的非常有道理,其实跟我的需求是一模一样的,就是腰椎间盘突出电脑前坐不住,有空还会继续推进项目的。

腰椎间盘突出是待坐一会儿动动揉揉,我也是这样。你这个需求确实不少人是需要的,光需要推理,不过原项目也是有一些小问题也还在迭代,如果能弄成可以直接使用新的版本推理就好了

@wycstc353
Copy link

很想知道,纯推理的话,配置要求能降到什么地步,一句话最低配置的话,要推理多久

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

6 participants