WebGLM: 基于人类偏好的高效网络增强问答系统

📃 论文 (KDD 2023)

本项目为WebGLM的官方实现。

demo.mp4

Read this in English.

概述
- 特点
开发准备
尝试WebGLM
训练WebGLM
- 训练生成器
  - 准备数据
  - 训练
- 训练检索器
  - 准备数据
  - 训练
评测
实际应用案例
引用

概述

WebGLM旨在使用10亿参数的通用语言模型（GLM）提供一种高效且低成本的网络增强问答系统。它旨在通过将网络搜索和召回功能集成到预训练的语言模型中以进行实际应用的部署。

特点

大模型增强检索器：增强了相关网络内容的检索能力，以更好地准确回答问题。
自举生成器：利用GLM的能力为问题生成回复，提供详细的答案。
基于人类偏好的打分器：通过优先考虑人类偏好来评估生成回复的质量，确保系统能够产生有用和吸引人的内容。

开发准备

准备代码和环境

克隆此仓库，并安装所需第三方库

pip install -r requirements.txt

安装Nodejs。

apt install nodejs # 如果你使用Ubuntu

安装 playwright 依赖项。

playwright install

如果你的主机中没有安装浏览器环境，则需要安装。不用担心，如果是这种情况，playwright会在首次执行时出现说明。

准备SerpAPI密钥

在搜索过程中，我们使用SerpAPI获取搜索结果。你需要从这里获取SerpAPI密钥。

然后将环境变量SERPAPI_KEY设置为你的密钥。

export SERPAPI_KEY="YOUR KEY"

下载检索器权重

通过运行以下命令从清华云下载检索器的权重。

你可以通过 --save SAVE_PATH 手动指定检索器权重的保存路径。

python download.py retriever-pretrained-checkpoint

尝试WebGLM

在运行代码之前，请确保你的设备空间足够。

导出环境变量

将环境变量WEBGLM_RETRIEVER_CKPT设定为检索器权重的路径。如果你已将检索器权重下载到默认路径，可以直接运行以下命令行。

export WEBGLM_RETRIEVER_CKPT=./download/retriever-pretrained-checkpoint

以命令行界面运行

你可以尝试WebGLM-2B模型：

python cli_demo.py -w THUDM/WebGLM-2B

或直接尝试WebGLM-10B模型：

python cli_demo.py

以Web服务形式运行

你可以尝试WebGLM-2B模型：

python web_demo.py -w THUDM/WebGLM-2B

或直接尝试WebGLM-10B模型：

python web_demo.py

训练WebGLM

训练生成器

准备数据

运行下面的命令行从清华云下载训练数据。

python download.py generator-training-data

它将自动下载所有数据，并将它们预处理成可以立即在./download中使用的seq2seq格式。

训练

请参考GLM仓库进行seq2seq训练。

训练检索器

准备数据

通过运行以下命令行，从清华云下载训练数据。

python download.py retriever-training-data

训练

运行以下命令行来训练检索器。如果你已经在默认路径下载了检索器训练数据，可以直接运行以下命令行。

python train_retriever.py --train_data_dir ./download/retriever-training-data

评测

你可以在 TriviaQA、WebQuestions 和 NQ Open 上重现我们的结果。以 TriviaQA 为例，可以运行以下命令行：

bash scripts/triviaqa.sh

并开始进行评测。

真实应用案例

您可以在这里查看一些WebGLM实际应用场景的示例。

引用

如果您针对您的研究使用了这个代码，请引用我们的论文。

@misc{liu2023webglm,
    title={WebGLM: Towards An Efficient Web-Enhanced Question Answering System with Human Preferences},
    author={Xiao Liu and Hanyu Lai and Hao Yu and Yifan Xu and Aohan Zeng and Zhengxiao Du and Peng Zhang and Yuxiao Dong and Jie Tang},
    year={2023},
    eprint={2306.07906},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

该仓库已进行简化以便于部署。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

WebGLM: 基于人类偏好的高效网络增强问答系统

概述

特点

开发准备

准备代码和环境

准备SerpAPI密钥

下载检索器权重

尝试WebGLM

导出环境变量

以命令行界面运行

以Web服务形式运行

训练WebGLM

训练生成器

准备数据

训练

训练检索器

准备数据

训练

评测

真实应用案例

引用

FilesExpand file tree

README_zh.md

Latest commit

History

README_zh.md

File metadata and controls

WebGLM: 基于人类偏好的高效网络增强问答系统

概述

特点

开发准备

准备代码和环境

准备SerpAPI密钥

下载检索器权重

尝试WebGLM

导出环境变量

以命令行界面运行

以Web服务形式运行

训练WebGLM

训练生成器

准备数据

训练

训练检索器

准备数据

训练

评测

真实应用案例

引用