add tulu

lm-sys · merrymercy · Dec 9, 2023 · Nov 12, 2023 · Nov 12, 2023 · Nov 13, 2023
commit 9c6df575dbd79a6a0ba64e24b4aa6fa8366f3917
diff --git a/fastchat/model/model_registry.py b/fastchat/model/model_registry.py
@@ -67,6 +67,12 @@ def get_model_info(name: str) -> ModelInfo:
     "https://www.anthropic.com/index/introducing-claude",
     "Claude Instant by Anthropic",
 )
+register_model_info(
+    ["tulu-2-dpo-70b"],
+    "Tulu 2",
+    "https://huggingface.co/allenai/tulu-2-dpo-70b",
+    "Tulu 2 by UW/AllenAI",
+)
 register_model_info(
     [
         "vicuna-33b",
@@ -96,7 +102,7 @@ def get_model_info(name: str) -> ModelInfo:
     ["openchat-3.5"],
     "OpenChat 3.5",
     "https://github.com/imoneoi/openchat",
-    "OpenChat 3.5 is a versatile, open-source language model fine-tuned using C-RLFT",
+    "an open model fine-tuned on Mistral-7B using C-RLFT",
 )
 register_model_info(
     ["mistral-7b-instruct"],

diff --git a/fastchat/serve/gradio_block_arena_anony.py b/fastchat/serve/gradio_block_arena_anony.py
@@ -160,13 +160,14 @@ def share_click(state0, state1, model_selector0, model_selector1, request: gr.Re
 SAMPLING_WEIGHTS = {
     # tier 0
     "gpt-4": 4,
-    "gpt-4-turbo": 4,
+    "gpt-4-turbo": 8,
     "gpt-3.5-turbo": 2,
     "gpt-3.5-turbo-1106": 4,
     "claude-2.1": 4,
     "claude-2.0": 4,
     "claude-1": 4,
     "claude-instant-1": 4,
+    "tulu-2-dpo-70b": 2,
     "zephyr-7b-beta": 2,
     "openchat-3.5": 2,
     "chatglm3-6b": 2,
@@ -216,6 +217,7 @@ def share_click(state0, state1, model_selector0, model_selector1, request: gr.Re
     "claude-1": {"claude-2.1", "gpt-4", "gpt-3.5-turbo"},
     "claude-instant-1": {"gpt-3.5-turbo", "claude-2.1"},
     "deluxe-chat-v1.1": {"gpt-4", "gpt-4-turbo"},
+    "tulu-2-dpo-70b": {"gpt-3.5-turbo", "vicuna-33b", "claude-instant-1"},
     "openchat-3.5": {"gpt-3.5-turbo", "llama-2-70b-chat", "zephyr-7b-beta"},
     "chatglm3-6b": {"chatglm2-6b", "qwen-14b-chat", "gpt-3.5-turbo"},
     "qwen-14b-chat": {"vicuna-13b", "llama-2-13b-chat", "llama-2-70b-chat"},
@@ -242,8 +244,9 @@ def share_click(state0, state1, model_selector0, model_selector1, request: gr.Re
 }
 
 SAMPLING_BOOST_MODELS = [
+    "tulu-2-dpo-70b",
     "openchat-3.5",
-    "gpt-4-turbo",
+    #"gpt-4-turbo",
     "claude-2.1",
     #"claude-1",
 ]