PinnedPinnedPrivate
huyenchip.com最近,我与 Dropbox、Langchain、Elastics 和 Anthropic 一起参加了一个关于 LLM 的讨论会,他们认为公司在生产中采用 LLM 的第一大障碍是幻觉。减轻幻觉和制定衡量幻觉的标准是一个蓬勃发展的研究课题,我看到许多初创公司都在关注这个问题。了解更多有关幻觉的信息: 自然语言生成中的幻觉调查(Ji 等人,2022 年) 语言模型幻觉如何像滚雪球一样越滚越大(Zhang 等人,2023 年) 多任务、多语言、多模态评估 ChatGPT 对推理、幻觉和互动性的影响(Bang 等人,2023 年) 对比学习可减少对话中的幻觉(Sun 等人,。根据这篇很酷的论文 SituatedQA(Zhang & Choi,2021 年),很大一部分信息搜索问题的答案都与上下文有关,例如,在自然问题 NQ-Open 数据集中约占 16.5%。语境长度对于 RAG(Retrieval Augmented Generation)(刘易斯等人,2020 年)尤为重要,RAG 已成为 LLM 行业用例的主要模式。