Skip to content

OpenMOSS/MOSS

 
 

Repository files navigation

MOSS

Inference

blitz

提供不带tool版本的推理脚本,以任何你喜欢的方式load模型之后,
以任何你喜欢的方式运行:
python moss_inference.py 或者直接在moss_infer_demo.ipynb中探索。

当然由于这是一个不带Tools的推理,如果你需要用它来服务,那么你需要至少在别的地方将输入的"<|Commands|>"和"<|Results|>"内的值改为None,并且需要修改部分代码使得for能够在遇到""时返回。

Details

对于显存小于48G,提供了hugginface accelerate的model parallelism方法,该方法需要至少两张3090(24G)。
采样策略包括: temperature, repetition_penalty, top_k, top_p。

About

An open-source tool-augmented conversational language model from Fudan University

Topics

Resources

License

Apache-2.0, AGPL-3.0 licenses found

Licenses found

Apache-2.0
LICENSE
AGPL-3.0
MODEL_LICENSE

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 16

Languages