temperature 관련 (서유빈)

서유빈입니다.

Chapter 5 영상 23:55
LLM이 다음 단어를 생성할 때 temperature를 적용해 확률이 낮은 단어까지 선택하는 경우가 있는 것으로 알고 있습니다.
기존 모델들처럼 확률이 가장 높은 것만 선택하는 것이 아니라 LLM이 낮은 확률의 단어까지 선택하는 특별한 이유가 있는지 궁금합니다.
개인적으로는 확률이 가장 높은 것만 선택하는 게 좋은 것 같은데
이렇게 낮은 확률의 단어를 선택하는 것이 단순히 문장 생성의 '자연스러움' 때문인지 아니면 다른 이유가 있는지 알고 싶습니다.