在过去几周中,我们已经看到了新一代模型作为产品的两个典型示例:OpenAI 的 DeepResearch 和 Claude Sonnet 3.7。正如 Hanchung Lee所强调的那样,所有其他 DeepSearch(包括 Perplexity 和 Google 变体)都只是普通模型,只是有一些变化: Google 的 Gemini 和 Perplexity 的聊天助手也提供“深度研究”功能,。我们在 Claude 3.7 的发布中对此进行了非常具体的展示,该模型主要针对复杂的代码用例进行训练。简而言之,Claude 的目标是颠覆和取代当前的工作流程,比如 llama index 中的这个基本“代理”系统: With this: 有了这个: 重申一下:大型实验室的推进并非隐藏议程。Databricks 的 Gen AI 副总裁 Naveen Rao对此进行了很好的阐述: 所有封闭式 AI 模型提供商将在未来 2-3 年内停止销售 API。
考虑到 Perplexity 的雄心壮志以及它从 Jeff Bezos 的家庭基金、Nvidia 和著名投资者 Balaji Srinivasan 等人那里获得的投资,令人惊讶的是,这家人工智能搜索初创公司究竟是什么,目前仍然不太清楚。今年早些时候,Perplexity 的首席执行官 Aravind Srinivas 在接受《WIRED》采访时描述了他的产品——一款聊天机器人,可以用自然语言回答提示,并且据公司称,可以实时访问互联网——称其为“答案引擎”。”最近,当《福布斯》指责 Perplexity 剽窃其内容时,Srinivas 告诉美联社,这只是一个“信息聚合器”。一项 WIRED 分析和开发者 Robb Knight 进行的研究表明,Perplexity 似乎通过部分忽略一个被广泛接受的网页标准,即机器人排除协议,来秘密地抓取网站上运营商不希望机器人访问的区域,尽管声称不会这样做。
对大量开源 AI 项目的整理显示,生态大致分为基础设施、模型、编排与开发工具、最终应用等层次。热门应用集中在编码、机器人、工作流自动化和信息聚合,向量数据库与推理服务支撑其运行。项目热度变化很快,但分层观察有助于判断重复建设、基础能力和真正的产品机会。
就我而言,我使用 ChatGPT 主要是为了帮助改写不同风格的内容--例如,让科学更适合普通读者,或者为财务人员归纳我的研究。ABEBA BIRHANE:考虑一下是否应该使用它 认知科学家 Abeba Birhane.Credit: Piquant 现在,法学硕士已成为主流,许多学者都感受到了压力,他们必须加入到这一行列中来,否则就会被视为错失良机。今年 1 月,我的联系人罗布-列侬(Rob Lennon)一直在尝试使用提示功能,他在 X(Twitter 的前身,见 go.nature.com/3teexb1)上写了一篇关于如何将聊天机器人最好地用于商业目的的文章。例如,可以为一门课程创建一个自定义 ChatGPT,要求它始终根据所提供的课程材料来回答问题。
但是,除了 ChatGPT 之外,消费者是如何与生成式人工智能(GenAI)产品互动的?大多数领先产品都是围绕生成式人工智能 "从头开始 "打造的 与 ChatGPT 一样,这份榜单上的大多数产品在一年前都不存在--这些网站中有 80% 都是新网站。在上榜的 50 家公司中,只有 5 家是原有大型科技公司的产品或被其收购:Bard(谷歌)、Poe(Quora)、QuillBot(Course Hero)、Pixlr(123RF)和Clipchamp(微软)。特别是在移动端,CharacterAI 是早期最强大的参与者之一--根据 Sensor Tower 的数据,其 DAUs 可与 ChatGPT 相媲美,而且留存率明显更高。不过,近几个月来,另外两类工具也开始得到大量使用--人工智能伴侣(如 CharacterAI)和内容生成工具(如 Midjourney 和 ElevenLabs)。
CHAT 栈说明,许多基于 GPT-4 的应用并不需要把专有数据重新训练进模型。更现实的做法是让应用在模型外部维护聊天历史和上下文数据库:用户提出问题后,系统先用相关性搜索从私有资料中找出最有用的片段,再把用户问题、近期对话和这些片段一起放进模型的 token 窗口,由模型基于临时上下文生成回答。这样,SaaS 客服、企业知识库、新员工入职、个人写作档案问答,都能在不昂贵训练模型的前提下拥有“懂业务数据”的聊天界面。关键持久状态有两类:消息历史保存交互脉络,上下文库保存可检索资料;嵌入和向量数据库会帮助在有限 token 中放入最相关的信息。聊天界面的风险也来自同一结构:模型先前的输出会进入后续输入,用户不断引入新变量,使行为难以在上线前穷尽测试。软件近期变化的核心,将是事件流、检索和大模型推理的结合。
低价且易用的 ChatGPT API 显著降低了文本生成能力的接入成本,使许多仅靠包装通用生成模型的产品失去差异化。文章用简单程序展示 API 如何快速构建角色对话,并讨论价格变化对应用生态的影响。具体模型和价格已经具有时效性,长期结论是基础能力商品化会迫使产品寻找数据、流程和用户价值壁垒。