人工智能

AI、LLM、Agent、RAG、模型、提示词相关链接。

172 threads

PinnedPinnedPrivate
norahsakal.com

MCP(模型上下文协议)是一种新的开放协议,旨在标准化应用程序向大型语言模型 (LLMs) 提供上下文的方式。将 MCP 视为适用于 AI 代理的 USB-C 端口:它提供了一种将 AI 系统连接到各种工具和数据源的统一方法。 模型上下文协议 (MCP) 是一种标准化协议,可将 AI 代理连接到各种外部工具和数据源。模型上下文协议 (MCP)是一种将 AI 代理连接到各种外部工具和数据源的标准化协议 正如 USB-C 简化了您将不同设备连接到计算机的方式一样,MCP 简化了 AI 模型与您的数据、工具和服务交互的方式。每个 API 集成都意味着单独的代码、文档、身份验证方法、错误处理和维护。 MCP(模型上下文协议)最初是Anthropic ↗的一个项目,旨在使 AI 模型(如 Claude)更容易与工具和数据源进行交互。


PinnedPinnedPrivate
magazine.sebastianraschka.com

提高大型语言模型的推理能力 (LLMs) 已成为 2025 年最热门的话题之一,这是有充分理由的。与仅共享最终答案的简单问答不同,推理模型要么明确显示其思维过程,要么在内部进行处理,这有助于它们在复杂任务(例如谜题、编码挑战和数学问题)中表现更好。然而,LLMs 通常旨在通过结合大量训练时间计算(大量训练或微调,通常使用强化学习或专门数据)和增加测试时间计算(允许模型“思考更长时间”或在推理期间执行额外计算)来改进推理。在这个问题中,我将重点介绍2025 年 1 月 22 日 DeepSeek R1 发布之后发布的关于扩展推理时间计算扩展的有趣的新研究论文和模型发布。例如,OpenAI 使用强化学习开发了其 o1 模型,然后又利用了推理时间计算扩展。一种方法是提示工程,例如思路链 (CoT) 提示,其中“逐步思考”等短语会引导模型生成中间推理步骤。2022 年大型语言模型中的经典 CoT 提示的一个示例是零样本推理器论文 ( 另一种方法涉及投票和搜索策略,例如多数投票或集束搜索,通过选择最佳输出来改进响应。


PinnedPinnedPrivate
vintagedata.org

在过去几周中,我们已经看到了新一代模型作为产品的两个典型示例:OpenAI 的 DeepResearch 和 Claude Sonnet 3.7。正如 Hanchung Lee所强调的那样,所有其他 DeepSearch(包括 Perplexity 和 Google 变体)都只是普通模型,只是有一些变化: Google 的 Gemini 和 Perplexity 的聊天助手也提供“深度研究”功能,。我们在 Claude 3.7 的发布中对此进行了非常具体的展示,该模型主要针对复杂的代码用例进行训练。简而言之,Claude 的目标是颠覆和取代当前的工作流程,比如 llama index 中的这个基本“代理”系统: With this: 有了这个: 重申一下:大型实验室的推进并非隐藏议程。Databricks 的 Gen AI 副总裁 Naveen Rao对此进行了很好的阐述: 所有封闭式 AI 模型提供商将在未来 2-3 年内停止销售 API。


PinnedPinnedPrivate
mckinsey.com

我自己也过一篇文章:AI对保险的价值| 胡说八道 - 特立独行的异类 By DemoChen作为参考。欢迎来到2030年斯科特(Scott)的眼中所见的保险未来。斯科特(Scott)的私人助理绘制了一条潜在的路线,并与他的出行保险公司分享了一条潜在的路线,该保险公司立即以一条替代路线做出回应,该路线的事故和汽车损坏的可能性要低得多,并且对他的每月溢价进行了计算的调整。随着经纪人,消费者,金融中介机构,保险公司和供应商的发展,变革的步伐也将加速,更擅长使用先进的技术来提高决策和生产力,降低成本并优化客户体验。四个核心技术趋势与AI紧密相结合(有时是由),将在未来十年内重塑保险业。例如,可穿戴数据可以直接移植到保险公司,并且可以通过亚马逊,苹果,Google和各种消费者设备制造商提供连接的房屋和自动数据。Distribution 分配 购买保险的经验更快,保险公司和客户的积极参与较少。


PinnedPinnedPrivate
pashpashpash.substack.com

根据我在 vault.pash.city 工作的经验,超过 40%的用户查询都是针对文档的。” 这个用例的受欢迎程度促使我开发了一个新的迷你应用:summarize.wtf Summarize.wtf 允许您上传任何文档——无论是 PDF、txt、ePub 还是 Docx——并生成不同长度的短(推文长度)、中(一个段落)或长(详细和全面)。对于足够短的文档,可以适应LLM(大型语言模型)长上下文窗口——范围从 16,000 到 32,000 个标记,或大约 32-64 页——任务是简单的。在基本层面上,Map-Reduce 是一个两步过程: 首先,文档的各个部分被归纳(地图), 然后,这些小被组合成最终(Reduce)。因此,Map-Reduce 迄今为止是 AI 中最昂贵的方法之一。然后,您可以使用像 K-means 这样的聚类算法来识别这些簇,并从每个簇中提取中心点(或点的集合),以提取代表该主题簇的“平均意义”的代表性块。


PinnedPinnedPrivate
ben-evans.com

更好的模型会更好吗不能只看表面答案,真正重要的是理解问题背后的机制、边界和现实代价。但很多问题并没有更好的答案,只有“正确”的答案,而这些模型无法做到这一点。不过,在这里我们遇到了一个问题,因为有些任务更好的模型会产生更好、更准确的结果,但还有一些任务没有所谓的“更好”的结果,也没有“更准确”的说法,只有对或错。这是相同的提示应用于 Midjourney 版本 3、4、5 和 6.1。今年或这个十年,这种变化如何以及是否会发生,是关于这些模型是否会持续扩展的中心辩论的一部分,实际上也是关于 AGI 的辩论,在这个问题上我们唯一可以肯定的是,我们没有一个理论框架可以告诉我们。如果你在 Claude 上尝试我上面的电梯问题,它会直截了当地告诉你这看起来像是一个特定的信息检索问题,并且它可能会产生幻觉,因此拒绝尝试。问一个LLM是否能够进行非常具体和精确的信息检索,可能就像问一个 Apple II 是否能够与大型机的正常运行时间相匹配,或者问你是否可以在 Netscape 中构建 Photoshop。


PinnedPinnedPrivate
magazine.sebastianraschka.com

理解推理模型,关键是把目标、限制和可执行步骤放在同一个框架里,而不是只追求单点技巧。因此,今天当我们提及推理模型时,我们通常指的是擅长完成更复杂推理任务的 LLMs ,例如解决谜题、谜语和数学证明。其次,某些推理LLMs(例如 OpenAI 的 o1)会进行多次迭代,中间步骤不会显示给用户。研究小组在 R1-Zero 模型 "冷启动 "的基础上,通过增加 SFT 阶段和进一步的 RL 训练,进一步完善了该模型。(3) DeepSeek-R1-Distill\:DeepSeek 团队利用前几步生成的 SFT 数据,对 Qwen 和 Llama 模型进行了微调,以提高它们的推理能力。在本节中,我将概述目前用于增强 LLMs 的推理能力以及构建 DeepSeek-R1、OpenAI 的 o1 和 o3 等专用推理模型的关键技术。2022 Large Language Models are Zero-Shot Reasoners》一文中的一个经典 CoT 提示示例 ( 上述 CoT 方法可视为推理时间扩展,因为它通过生成更多的输出标记来增加推理的成本。


PinnedPinnedPrivate
anthropic.com

创建 agent,关键是把目标、限制和可执行步骤放在同一个框架里,而不是只追求单点技巧。另一方面,在代理系统中,LLMs可以动态地指导自己的进程和工具使用,并保持对完成任务方式的控制。何时(以及何时不)使用代理 在使用 LLMs 构建应用程序时,我们建议尽可能寻找最简单的解决方案,只有在需要时才增加复杂性。有许多框架使代理系统更容易实施,其中包括 LangGraph 来自 LangChain;以及 Vellum 是另一款用于构建和测试复杂工作流程的图形用户界面工具。虽然有很多方法可以实现这些增强功能,但其中一种方法是通过我们最近发布的《模型上下文协议》(Model Context Protocol),该协议允许开发人员通过简单的客户端实现与不断增长的第三方工具生态系统集成。将简单/常见问题分配给 Claude 3.5 Haiku 等较小的模型,将困难/异常问题分配给 Claude 3.5 Sonnet 等能力较强的模型,以优化成本和速度。


PinnedPinnedPrivate
appblit.com

达里奥·阿莫代把 Anthropic 面对的核心问题放在规模化与安全治理之间:更大的模型、更多数据和更长训练曾持续推高能力,反对规模化的理由也多次被新方法绕过,因此未来几年仍可能出现接近博士水平、可大规模部署的系统。真正的风险不只在模型更聪明,而在权力被少数组织集中后可能放大滥用和社会伤害。围绕 Claude 的对齐工作,则落在性格设计、微调、可解释性和欺骗检测上;Chris Olah 的机械可解释性尝试从神经激活反推模型内部机制,Amanda Askell 关注怎样让 Claude 更可靠、更有边界。这组对话把 AGI 讨论从概念拉回工程现实:能力曲线、部署规模、组织责任和安全研究必须同时推进。


PinnedPinnedPrivate
weaviate.io

Retrieval-Augmented Generation (RAG) 允许模型从外部来源提取实时的利基数据,从而增强其提供准确和详细响应的能力,从而帮助缓解这种情况。生成模型的局限性 生成模型在大型数据集上进行训练,包括(但不限于)社交媒体帖子、书籍、学术文章和抓取的网页,使它们能够获得一般知识。 检索增强生成 (RAG) 是一个框架,它通过向生成式 LLM与从外部数据源检索的手头任务相关的额外数据来增强生成式 代码 id=g1001 LLM 的一般知识。RAG 架构 RAG 管道的基本部分可以分为三个部分:外部数据源、提示模板和生成模型。


PinnedPinnedPrivate
nngroup.com

Discovery 帮助我们决定构建什么或追求什么方向。避免解决方案思维模式的 3 种方法 许多发现都是从探索解决方案开始的。锚定:具有解决方案思维模式的团队通常会通过特定解决方案的视角进行发现研究。发现型思维方式意味着团队对学习持开放态度 他们的假设是错误的,无论这些假设是关于用户的问题、需求还是最佳解决方案。采用发现思维方式有助于团队收集有价值的见解,以确定正确的问题和解决方案。为避免以解决方案的思维方式开始发现,请围绕问题而不是解决方案来构建发现目标。2 突出未知数和假设 帮助我们采用发现思维模式的另一种策略是专注于我们知道和不知道的。3 Icebox 最喜欢的想法 为避免团队锚定于特定解决方案,团队可以在发现开始时构思解决方案,并同意将他们的解决方案想法“搁置”,直到发现研究完成。在团队完成发现研究并开始构思后,他们可以考虑 Icebox 中的解决方案,看看是否有任何合适的解决方案。


PinnedPinnedPrivate
buckhouse.medium.com

打招呼,关键是把目标、限制和可执行步骤放在同一个框架里,而不是只追求单点技巧。我们决定是否喜欢某样东西的时间介于 1/10 秒到 7 秒之间(Janine Willis 和 Alexander Todorov,2006)。研究表明,第一印象可以持续数月(Gunaydin, Selcuk, & Zayas,2017),并且即使在有相反证据的情况下也能影响一个人的观点(例如,Rydell & McConnell,2006),即使你无法回忆起原因(McCarthy & Skowronski,2011;这就是为什么网页需要在一秒钟内加载完成。这就是为什么 Instagram 和 TikTok 如此有效,以及广告牌上的文案如此简短。你的声音并不是从头部开始的,正如我们可能想象的那样,而是从你的腹部和心脏之间开始,依靠横膈膜的拉动。放松你的脸部,保持中性——不是死板——只是不要因为别人不分享的担忧而紧绷。


PinnedPinnedPrivate
theguardian.com

我的妻子一直说她会死于阿尔茨海默病。当我们相遇时,在 00 年代中期,很容易捍卫的观点是 Vanessa 没有患阿尔茨海默病,也不会患上这种疾病。在我们的关系发展了几周后,她告诉我,她 50 多岁的母亲患有阿尔茨海默病,而且稍后又说她也肯定会得这种病。然而,对外界而言,阿尔茨海默病是逐渐显露出来的,每一个细微的迹象在早期都可能被轻易地解释为“无关紧要”。你从未听说过有人勇敢地与痴呆症作斗争,就像对抗其他许多疾病一样,因为你无法与之抗争。Vanessa 在她的巅峰时期领导团队,并为主要国际公司推出营销活动。我不确定我想让他们对此做什么,但我知道这次 MRI 扫描会激发出 Vanessa 所有的恐惧。接下来的 21 个月左右令人不安,她开始在我们的孩子面前崩溃,当时他们分别是 10 岁和 8 岁,不应该目睹这一切,更不用说承受后果,而她却被告知她的大脑没问题。Vanessa 的神经学家向我们解释说,她的脊髓液中缺乏淀粉样蛋白质,这意味着它必须在她的大脑中积聚。


PinnedPinnedPrivate
benkuhn.net

例如,最近我并不完全信任我的两位经理来制定他们团队的发展方向... 因为他们大约一周前加入,几乎还没弄好他们的笔记本电脑。一般来说,如果爱丽丝是鲍勃的经理,而且在优先考虑研究方向方面具有权威性,那么鲍勃可能正在努力构建一个良好的“爱丽丝心智模拟器”,这样他就可以自主进行优先排序,而不必一直进行确认。如果我有一个同事,我不信任他(比如)在做出良好的软件设计决策方面,我将不得不更仔细地审查他们的设计,并要求他们提前制定更彻底的计划。如果我有一个报告,我不完全信任来处理表现不佳的团队成员,我将不得不更加细致地管理他们,深入了解细节,了解发生了什么,并形成我自己的看法,反复检查情况,以确保它朝着正确的方向发展。例如,Anthropic 最近经历了一次紧要关头,其中我们的一个团队承受着巨大压力,迫切需要快速调试一个非常棘手的问题。我们之所以能够更高效地工作,是因为团队成员(包括大多数从其他地方加入调试工作的人)对彼此的能力非常信任;。


PinnedPinnedPrivate
wired.com

考虑到 Perplexity 的雄心壮志以及它从 Jeff Bezos 的家庭基金、Nvidia 和著名投资者 Balaji Srinivasan 等人那里获得的投资,令人惊讶的是,这家人工智能搜索初创公司究竟是什么,目前仍然不太清楚。今年早些时候,Perplexity 的首席执行官 Aravind Srinivas 在接受《WIRED》采访时描述了他的产品——一款聊天机器人,可以用自然语言回答提示,并且据公司称,可以实时访问互联网——称其为“答案引擎”。”最近,当《福布斯》指责 Perplexity 剽窃其内容时,Srinivas 告诉美联社,这只是一个“信息聚合器”。一项 WIRED 分析和开发者 Robb Knight 进行的研究表明,Perplexity 似乎通过部分忽略一个被广泛接受的网页标准,即机器人排除协议,来秘密地抓取网站上运营商不希望机器人访问的区域,尽管声称不会这样做。


PinnedPinnedPrivate
applied-llms.org

也可在 O’Reilly Media 上分为三个部分发布:战术、运营、战略。现在正是利用大型语言模型构建的激动人心时刻(LLMs)。此外,提供者 API 使LLMs更易访问,让每个人,而不仅仅是机器学习工程师和科学家,都能将智能融入其产品中。尽管使用人工智能构建的准入门槛已降低,但要创建有效的产品和系统——超越演示——仍然具有欺骗性的难度。我们打算将这本书打造成一个实用指南,教你如何用LLMs打造成功的产品,我们将从自身经验中汲取灵感,并指出行业中的案例。1 战术:与LLMs合作的基本要领 在这里,我们分享新兴LLM堆栈核心组件的最佳实践:提示技巧以提高质量和可靠性,评估策略以评估输出,检索增强生成的想法以改进基础,如何设计人在回路工作流程等。1.1.1 专注于充分利用基础提示技巧[]( 一些提示技巧一直以来都在改善各种模型和任务的性能方面发挥着一致的作用:n-shot 提示+上下文学习,思维链,以及提供相关资源。


PinnedPinnedPrivate
blockbuster.thoughtleader.school

训练自己更聪明地了解人工智能的方法,关键是把目标、限制和可执行步骤放在同一个框架里,而不是只追求单点技巧。凭借心智模型的力量,我在过去六个月里花费了数百个小时,收集了与人工智能相关的 100 个最重要的心智模型。为了决定我们如何做出反应,重要的是我们有意识地学习人工智能,而不是盲目地、本能地接受或拒绝决定。就像在市场中低买高卖是明智的一样,在其他人之前了解人工智能也是明智的。了解每条道路的局限性是至关重要的,才能超越它们 现在有数十个播客、通讯、博客、Twitter 账号和其他专家,涵盖了人工智能的每一个更新,从演示、提示和工具到传言、资金公告、档案和预测。虽然阅读人工智能新闻和进行基本提示都很关键,但在某个时候,它们的效果会递减,许多人只能等待 GPT 的出现。已被超过 342,000 人阅读,并介绍了以下图表… 2018 年初,Eben Pagan 和我决定合作创建心智模型俱乐部。


PinnedPinnedPrivate
yaofu.notion.site

2024 年 4 月 22 日发布 由于大多数简易网络文本(Common Crawl、Github、Arxiv ......等)已被使用殆尽,文本数据的扩展可能已达到上限。就像 AlphaGo Zero 在围棋上取得超人表现一样,自我对弈和与环境互动可能是超人生成模型的一个方向。规模游戏的第一章侧重于文本数据的规模化,在 GPT-4 中达到顶峰,在 Llama 3 中结束。LLaMA 3 70B 的一个特别之处在于,其性能远远优于同类 70B 级模型(MMLU 通常约为 70+),并进入了前沿模型体系(MMLU 为 80+)。我敢打赌,最终可能会收敛到大约 ELO 1180 的 GPT-4 0314 - 大约Claude 3 Haiku 性能(同样,相当不错)。百川技术报告中有一个很好的数据,说明了过滤对最终代币数量的影响: 应该在多大程度上保持质量和重复数据删除标准,这是一个研究问题(见 Shayne 等人、Muennighoff 等人和 Xue 等人)。


PinnedPinnedPrivate
lethain.com

在产品中使用 LLMs,关键是把目标、限制和可执行步骤放在同一个框架里,而不是只追求单点技巧。去年,我一直在直接研究LLMs 对现有产品的意义,并想打出一些半散乱的笔记。许多业内人士仍在为LLMs 建立心智模型,这导致他们对LLMs 能做什么以及我们应该如何使用它们产生了许多推理错误。LLM 您可以使用 evals(针对一组已知提示运行LLM 、记录响应并评估这些响应)来评估LLM 在特定场景中表现良好的可能性。一般来说,使用更大的模型可以提高精确度,但成本会更高,延迟也会更长--例如,GPT 4 是比 GPT 3.5 更大的模型,通常能提供更高质量的响应。即使是速度最快的LLMs 也没那么快,即使是速度最快的LLM 也可能需要 10 多秒钟才能提供合理大小的响应。相反,如何在不大幅缩减利润的情况下,为消费者业务中大量使用LLM 支付费用,则是一个非常具有挑战性的问题。


PinnedPinnedPrivate
jxnl.co

如果你在寻找一个微妙的视角, 这些只是我告诉自己的谎言,让我继续真诚地生活。我会尽我所能用我自己的经历来美化我的建议,但我不会假装我所经历的痛苦和特权是普遍的。选择可能是可怕的,因为它意味着我们要对自己的决定负责,我们面前有无限的选择。这也是可怕的,因为一旦我们做出了决定,我们必须忍受它,这是选择性的死亡。有一个伟大的实验,我不能引用,但它一直在我的脑海里,因为我是一个孩子。“ 我从这个实验中得到的想法是,幸运的人和不幸的人可能没有不同的机会,而是他们的感知范围更广。我认识到,不是每个人都有机会获得同样的网络机会,传统的工作申请流程对许多人来说是一个有效和必要的途径。但如果使用得当,社交媒体是获得机会的好方法 当我的厕所里满是大便,我妻子两个小时后就要回家的时候,我找到了一个水管工,水管工不会说,“天哪,谢谢你给我这个机会。在为奥运会而战之前,你需要牺牲人际关系,折断一些手指,经历ACL撕裂,甚至脑震荡。


PinnedPinnedPrivate
vikas.sh

进入深度学习领域,关键是把目标、限制和可执行步骤放在同一个框架里,而不是只追求单点技巧。我曾在 2012 年从事过机器学习和 Python 工作,但我说服自己,深度学习对我来说太复杂了。Kaggle 竞赛非常适合快速学习,但可能会让你在基础知识方面存在差距,比如算法在数学上是如何工作的。我第一次是自上而下地进行深度学习,在不了解模型如何工作的情况下将它们粘合在一起。您可以使用 Google Colab 获取免费/廉价的 GPU,也可以使用 Weights and Biases 跟踪您的训练运行情况。如果需要更多虚拟现实内存或多个 GPU,可以使用 Google Colab 或类似 Lambda Labs 的软件。我想训练模型,以便更好地编写代码,因此我整理了数据集,并根据 StackOverflow 和其他地方的数据对几个不同的基础模型进行了微调。另一种方法是从 pdf 中提取数据,并将其转化为良好的训练数据(markdown)。


PinnedPinnedPrivate
summerofprotocols.com

交通拥堵不是灾难,而是司空见惯的事情,往往是可以预测的,就像潮汐一样每天循环涨落。虽然交通堵塞的总成本可以用金钱或浪费的时间来量化,但它所造成的痛苦最终是个人的,是成千上万的驾驶员所经历的平凡而随意的乏味。无论移动速度多么缓慢,这种拥堵都不是静态的,而是流动的,是道路通行能力供应与需求之间的时间错配。乍一看,交通堵塞似乎是协调失败--不是任何人的错,而是自组织系统的突发产物。更好的协调机制可能会有所帮助,但这种优化所需的权衡往往是不可取的,会带来更高的成本或限制自由。交通堵塞问题不是用来解决的,而是用来管理的,这是应对在个人之间分配总收益和总成本这一挑战的一种可行方法。拥堵是交通的一个特征,而不是一个错误,它是一种必要的妥协,是对高吞吐量进行充分但 "笨拙 "的管理,而不是避免失败的笨拙。更根本的是,个人普遍认为他们想要的城市无法实现--他们缺乏塑造自己所居住的建筑环境的能力,房地产市场条件、数字平台、企业利益、庞大的基础设施网络以及不可阻挡的气候波动,取代了地方或个人对住房、公共空间、商业和其他城市系统的控制。


PinnedPinnedPrivate
hamel.dev

构建领域特定的LLM评估系统,关键是把目标、限制和可执行步骤放在同一个框架里,而不是只追求单点技巧。我发现,不成功的产品几乎总是有一个共同的根本原因:没有建立健全的评估系统。我目前是一名独立顾问,帮助公司构建领域特定的 AI 产品。为了将这个问题与现实情况联系起来,我将通过一个案例研究来介绍我们如何构建一个快速改进的系统。案例研究:Lucy,一个房地产 AI 助手 Rechat 是一个 SaaS 应用程序,允许房地产专业人员执行各种任务,例如管理合同、搜索房源、构建创意资产、管理约会等。[]( 为了突破这个停滞期,我们创建了一个以评估为中心的系统化改进 Lucy 的方法。有三个层次的评估需要考虑: 第二层:模型和人工评估(包括调试) Level 3 Level 2 Level 1 的成本依次递增,这决定了你执行它们的节奏和方式。例如,我经常在每次代码更改时运行 Level 1 的评估,按照一定的节奏运行 Level 2,而只在重大产品变化后才运行 Level 3。


PinnedPinnedPrivate
bentoml.com

2024 年 3 月 21 日 • 作者:Sherlock Xu 在过去的一年里,AI 领域一直在快速发布大型语言模型(LLMs),每个模型都以推动生成式 AI 的可能性为目标而取得了进展。就在上周末,xAI 发布了其 Grok 语言模型,该模型拥有 3140 亿个参数,采用 Apache 2.0 许可证。用户可以对其进行微调,以满足特定任务或行业的独特需求(在 Hugging Face Model Hub 中搜索“Llama2”可获得超过 12,000 个搜索结果)。在 Meta 的评估中,Llama 2 的 7B、13B 和 70B 参数模型显示出较低的安全违规百分比(3%和 4%),超过了 Falcon 和ChatGPT(7%)。Zephyr 7B 是基于 Mistral 7B 构建的,经过微调以更好地与人类意图对齐,在特定任务和基准测试中表现优于其他模型。在发布时,Zephyr-7B-β是 MT-Bench 和 AlpacaEval 基准测试中排名最高的 7B 聊天模型。


PinnedPinnedPrivate
appblit.com

萨姆讨论了 OpenAI 董事会传奇、伊利亚-苏茨克沃(Ilya Sutskever)、埃隆-马斯克(Elon Musk)诉讼、索拉(Sora)、GPT-4、内存与隐私以及 AGI。以下是与萨姆-阿尔特曼(Sam Altman)的对话,这是他第二次参加播客。他是 OpenAI 的首席执行官,OpenAI 是 GPT-4、ChatGPT、Sora 的幕后公司,也许有一天,这家公司就会打造出 AGI。带我回顾一下从 11 月 16 日星期四,也许是 11 月 17 日星期五开始的 OpenAI 董事会事件。我认为,从 OpenAI 启动到我们创建 AGI 之间的某个时间点,一定会发生一些疯狂和爆炸性的事情,但可能还会有更多疯狂和爆炸性的事情发生。好吧,回到那里,反思董事会结构、权力动态、公司运作方式、研究与产品开发之间的紧张关系、金钱和所有这些东西,还是很有帮助的,这样你就有很大可能在未来以一种稍微更有组织、不那么戏剧化的方式建造 AGI。


PinnedPinnedPrivate
huyenchip.com

我从 900 种最流行的开源人工智能工具中学到了什么不能只看表面答案,真正重要的是理解问题背后的机制、边界和现实代价。你也可以在我 GitHub 上的 cool-llm-repos 列表中找到其中大部分。最底层的堆栈是基础设施,包括服务工具(vllm、英伟达的 Triton)、计算管理(skypilot)、矢量搜索和数据库(faiss、milvus、qdrant、lancedb)、....。最流行的应用类型包括编码、工作流程自动化、信息聚合... 在这 4 层之外,我还有一个类别,即模型 repos,由公司和研究人员创建,用于共享与他们的模型相关的代码。最流行的应用程序类型是编码、机器人(例如 角色扮演、WhatsApp 机器人、Slack 机器人),以及信息聚合(如:...... "让我们把它连接到我们的 Slack,让它每天汇总信息")。该层的最新类别是向量数据库,包括 Qdrant、Pinecone 和 LanceDB 等公司。


PinnedPinnedPrivate
seantrott.substack.com

有趣的是,ChatGPT可以为自己的屡次失败给出合理的解释,比如难以理解否定。I even asked ChatGPT to generate its我甚至要求 ChatGPT 生成其 own prompt,and it responded as follows (bolding mine): 自己的提示,。但是,LLMs和否定并不是一个新问题。其他研究人员,如阿廖森-艾廷格(Allyson Ettinger)和加里-马库斯(Gary Marcus)都认为,LLMs始终无法以人类的方式理解否定。大约一个月前,加里-马库斯(Gary Marcus)写道,像 DALL-E 这样的图像生成工具一直无法理解否定,这反映出这些系统在工作方式上存在更多基础性问题。正如马库斯指出的那样,可能有一些提示符可以成功地做到这一点,但问题是ChatGPT总是无法遵从用户的指令,(他认为)这表明用户缺乏深刻的理解。


PinnedPinnedPrivate
noemamag.com

大型语言模型是否有意识不能只看表面答案,真正重要的是理解问题背后的机制、边界和现实代价。"让-马克-加斯帕德-伊塔德(Jean Marc Gaspard Itard)写道:"在阿韦龙的野人到来之前,巴黎人对他抱有最美好但最不合理的期望。维克多是我们可以在没有语言的情况下窥见人类经验本质的极少数案例之一,他一直被视为理解语言在我们思维运作中所起作用的关键。在过去的几年里,大型语言模型(LLMs)自发地发展出了令人不安的模仿人类思维的能力,有可能破坏我们在意识提升的基础上建立起来的脆弱的道德世界。认知科学家戴维-查莫斯(David J. Chalmers)所说的 "自我报告 "仍然是我们识别意识的主要标准之一--套用勒内-笛卡尔的话说,我说我想,所以我是。我们在这场辩论中的立场,对我们如何处理LLM事实上是否有意识这一问题有着重要影响。由此,研究人员得出结论,语言在人类思维的一项关键功能中扮演着基础性的角色:"心理综合",即仅从文字中创造和调整心理图像。


PinnedPinnedPrivate
nngroup.com

许多作家会求助于ChatGPT或其他人工智能聊天机器人来编辑和完善自己的语气。这一点在用词上尤为明显: 即使使用 "轻松愉快"、"雄心勃勃"、"充满活力 "或 "富有教养 "等更细致的语气描述符,ChatGPT仍然会夸大其词。使用多个形容词可以防止 ChatGPT 抓住一个特定的词,从而产生更自然、更会话的反应。使用样本来训练 ChatGPT 所取得的效果甚至比一组细微的语气词更好。就拿这份文案的语气来说吧: Mailchimp 使用生成式人工智能来自动执行人工营销任务,如撰写初稿或可视化数据。为了创建 Mailchimp/Plaid 示例的结果,我首先向 ChatGPT 提供了一个人工智能广告示例,然后要求它编辑另一家公司的版本。现在,只需进行少量编辑(或向 ChatGPT 提出请求),就可以在撰写或编辑新内容时使用此回复为自己、同事或 ChatGPT 提供指导。请ChatGPT分析你的语气,并将答复保存起来,以备今后指导和提示工程之用。


PinnedPinnedPrivate
taskade.com

与 GPT-4 或 Llama 2 等人工智能模型互动非常简单。提醒一下......所有示例都是使用 Taskade AI 制作的。大型语言模型(LLM)使用复杂的算法来分析语言结构、识别模式和理解上下文。语言模型在解读人类语言的细微差别方面非常出色,这在很大程度上要归功于自然语言处理(NLP)技术的进步。为了节省时间,您可以就预期回复的结构提供更多细节,例如要求提供要点、Markdown 语法、编号列表或简洁的段落。提取数据示例:日期:日期,与会者:姓名,关键决定:决定" 人工智能回应的语气与您与它互动时使用的语言和语气如出一辙。如果你要求人工智能模型以欢快、简单的方式解释某件事情,它就会调整自己的语言以适应这一要求。每次对人工智能提示进行微调,都是在向人工智能模型传授更多关于你所追求的东西的知识。从本质上讲,你是在 "训练 "人工智能在特定环境下模仿人类的交流方式--正确的词语、语气和反应,让模型看起来更像人类,而不是花言巧语。


PinnedPinnedPrivate
huyenchip.com

利用人类偏好对模型进行排序 ....优先排序的工作原理 ....聊天机器人竞技场排名的正确性 ........评估数据 预测人类对每个提示的偏好 ........特定领域和特定查询的排行榜 人类偏好已成为人工智能模型开发的北斗星和有力工具。LMSYS 的聊天机器人竞技场(Chatbot Arena)也使用人类偏好对人工智能模型进行排序。预测人类偏好的一个应用案例是模型路由。例如,如果我们事先知道,对于某个提示,用户更喜欢 Claude Instant 的响应而不是 GPT-4,而 Claude Instant 又比 GPT-4 更便宜/更快,那么我们就可以将该提示路由到 Claude Instant。除了为 LMSYS 的聊天机器人竞技场提供动力外,它还被许多模型提供商(Anthropic、Gemini、ChatGPT 等)用于评估其生产中的模型。


PinnedPinnedPrivate
martinfowler.com

它利用 AWS 服务(Transcribe、Bedrock 和 Polly)将人类语音转换为文本,通过LLM 处理输入,最后将生成的文本响应转换回语音。POC 的高级设计包括为演示目的创建基于网络的界面、转录用户的口语输入(语音转文本)、获取LLM 生成的响应(LLM 和提示工程)以及播放LLM 生成的音频响应(文本转语音)所需的所有组件和服务。测试我们的LLMs (我们应该这样做,我们做到了,而且非常棒) 在 2023 年 9 月撰写的《为什么人工测试LLMs 很难》一书中,作者与数百名使用LLMs 的工程师进行了交谈,发现人工检查是测试LLMs 的主要方法。为了帮助测试,我们要求LLM 以结构化的 JSON 格式返回响应,其中一个关键字是我们在测试中可以依赖和断言的("intent"),另一个关键字是LLM 的自然语言响应("message")。让我们通过一个需要处理 "打开 "任务的LLM 应用程序示例,来探讨基于属性的测试和自动评估器测试。


PinnedPinnedPrivate
appblit.com

一口气了解英伟达,芯片新王凭什么是他不能只看表面答案,真正重要的是理解问题背后的机制、边界和现实代价。当天股价飙升 30%,市值达到万亿美元,推动英伟达成为全球第六大公司,超越特斯拉,逼近亚马逊,谁能想到一家卖显卡的公司会成为人工智能大战的最大赢家。2023 年过去几年,英伟达几乎参与了全球所有的科技创新,云计算、加密货币、元宇宙人工智能。英伟达是所有这些领域的主要参与者,你听说过的大多数人工智能模型,都是用英伟达显卡训练出来的。作为行业领导者,他们却垄断了全球人工智能训练行业 95% 的市场份额。甚至,拥有英伟达 A100 显卡的数量,也是衡量一家公司计算能力的指标。大学毕业后,他在两家专注于芯片设计的半导体公司工作。于是,1993 年,他们成立了专门从事图形处理的英伟达公司。但现在,任何人都可以通过购买英伟达显卡并使用 CUDA 库来实现这一点。


PinnedPinnedPrivate
journal.everypixel.com

在今年的人工智能发展中,我们取得了显著的进步,完善了现有技术,而不是像前一年的 ChatGPT 或图像生成器那样推出突破性的创新。与 Photoshop 集成后,Adobe Firefly 实现了人工智能的民主化,将其威力一次性扩展到广大用户群。文本到图像算法的演变,2007 年与 2023 年对比 Stability AI:Stability AI 推出了用于生成视频的开创性模型 Stable Video Diffusion,可在 GitHub 上开源访问。谷歌的 Gemini 被引入 Bard 聊天机器人并在多模态数据集上进行训练,成为 "能力最强 "的人工智能模型,也是 OpenAI 的 ChatGPT 最接近的竞争对手。Grok:埃隆-马斯克(Elon Musk)的初创公司xAI发布了一款名为 "Grok "的聊天机器人,它幽默、叛逆,并能通过𝕏平台实时获取知识,这表明该公司致力于开发人工智能,有可能与OpenAI展开竞争。


PinnedPinnedPrivate
fs.blog

模型将世界浓缩成可以理解和使用的小块。例如,速度是一种心智模式,它能帮助你理解速度和方向都很重要。互惠是一种心智模式,它能帮助你理解积极行动和先行一步是如何让世界为你做大部分工作的。就像知道站在什么位置能把一张好照片变成一张好照片一样,改变你对某种情况的看法能揭示关键信息并提供新的解决方案。你必须在头脑中建立模型,并将你的经验--包括替代经验和直接经验--排列到这个心智模型的格子上。以下这些重要理念可以帮助你做出更好的决策,避免问题,并发现别人错失的机会。第一原理思维是逆向设计复杂情况、释放创造可能性的最佳方法之一。相对论在物理学界有多种应用,但研究的重要方面是观察者无法真正理解他自己也是其中一部分的系统这一观点。2 Evolution Part Two: Adaptation and The Red Queen Effect2.进化论》第二部分:适应与红皇后效应 在遗传和环境的共同作用下,物种为了生存往往会适应周围的环境--这是一个始终无法避免的组合。


PinnedPinnedPrivate
sixthtone.com

中国是否已达到香料峰值不能只看表面答案,真正重要的是理解问题背后的机制、边界和现实代价。只是随着 20 世纪 90 年代和 21 世纪的大规模移民,辣味菜肴才开始在中国沿海地区普及。中国餐饮产业研究院和外卖应用程序美团的两项最新调查发现,虽然香料仍然是王道,但粤菜的温和口味正在卷土重来。但中国人的饮食习惯一般可分为所谓的 "八大菜系":山东菜系、四川菜系、湖南菜系、广东菜系、福建菜系、江苏菜系、浙江菜系和安徽菜系。(这一传统分类系统遗漏了许多地区的烹饪传统,包括云贵高原的酸辣口味和西北地区的羊肉菜肴)。有趣的是,粤菜餐厅仍然集中在中国东部沿海地区,内陆地区的点心爱好者很少有选择。另一方面,川菜已经走向全国,即使在广东和江苏等传统上不喜欢吃辣的地区,川菜餐厅的比例也达到了 6% 到 9%。约 44% 的受访者表示,他们最喜欢 "清淡 "或 "鲜美 "的口味,这两种口味都是粤菜的显著特点,因为粤菜尽量少用调味料,以保持食材的原汁原味。


PinnedPinnedPrivate
pub.towardsai.net

格罗宁根,马蒂尼托伦,在 Noorderplatsoen 的和平时期撰写文章的地方 对先进的检索增强生成技术和算法的全面研究,将各种方法系统化。检索增强生成(Retrieval Augmented Generation),又称 RAG,为 LLM 提供从某些数据源检索到的信息,作为生成答案的基础。chroma、weavaite.io 和 pinecone 等矢量数据库初创公司都建立在现有的开源搜索索引(主要是 faiss 和 nmslib)基础上,并在最近增加了输入文本的额外存储空间和其他一些工具。这个问题的目的是系统地介绍关键的高级 RAG 技术,并参考其实现方法(主要是 LlamaIndex 中的实现方法),以方便其他开发人员深入研究该技术。显然,尽管 OpenAI 是 LLM 供应商的市场领导者,但也有许多替代方案,例如 Anthropic 的 Claude、最近流行的较小但能力很强的模型 Mixtral form Mistral、微软的 Phi-2,以及许多开源方案,例如 Llama2、OpenLLaMA、Falcon,因此您可以为您的 RAG 管道选择大脑。


PinnedPinnedPrivate
timconnors.co

我最近一直在研究网络抓取器,随着人工智能的发展,我觉得尝试构建一个 "通用 "抓取器可能会很有趣,它可以反复浏览网络,直到找到它要找的东西。对于我的网络爬虫库,我决定使用 Crawlee,它提供了一个浏览器自动化库 Playwright 的封装。Crawlee 增强了浏览器的自动化功能,使刮擦程序更容易伪装成人类用户。在这两个 API 中,我总共使用了三种不同的模型: GPT-4-Turbo 型号与最初的 GPT-4 类似,但上下文窗口更大(128k 个 token),速度更快(高达 10 倍)。(我最终使用 Azure 的 OpenAI 服务访问 GPT-4-32K,因为 OpenAI 目前限制在自己的平台上访问该模型) 我首先从我的制约因素开始倒推。由于我在引擎盖下使用的是 Playwright 爬虫,我知道如果要与页面交互,最终需要从页面中获取元素选择器。我担心文本模型在这种情况下会表现不佳,所以我想使用 GPT-4-Turbo-Vision 模型来规避这一切,它可以简单地 "查看 "渲染的页面,并从中转录最相关的文本。


PinnedPinnedPrivate
jarango.com

他们的ChatGPT是历史上增长最快的产品:仅在推出两个月后,就已经拥有1亿活跃用户。)简而言之:在11月17日,OpenAI的董事会解雇了该公司受欢迎的CEO Sam Altman,这是一个意外的举动,引发了员工的不安(95%的员工威胁要辞职)以及OpenAI的主要合作伙伴微软的不满。这需要两件事: 等待相关事实的出现,以及 从这些事实中得出意义的框架 在这个问题的其余部分,我将向您介绍这样一个框架——冰山模型,并通过这个框架解释OpenAI的情况。冰山模型解释了您可以理解这样一个系统的不同层次: 图片来自ecochallenge.org 该框架使用冰山的隐喻,因为我们只倾向于看到发生的事情——第一层。在 OpenAI 的案例中,2022 年 11 月 6 日的产品发布是一系列商业产品中的最新动态,该系列始于 2020 年的 GPT-3 API,接着是 2021 年的 DALL-E,以及 2022 年的 ChatGPT。


PinnedPinnedPrivate
nature.com

ChatGPT 一周年:谁在使用、如何使用、为什么使用不能只看表面答案,真正重要的是理解问题背后的机制、边界和现实代价。就我而言,我使用 ChatGPT 主要是为了帮助改写不同风格的内容--例如,让科学更适合普通读者,或者为财务人员归纳我的研究。ABEBA BIRHANE:考虑一下是否应该使用它 认知科学家 Abeba Birhane.Credit: Piquant 现在,法学硕士已成为主流,许多学者都感受到了压力,他们必须加入到这一行列中来,否则就会被视为错失良机。今年 1 月,我的联系人罗布-列侬(Rob Lennon)一直在尝试使用提示功能,他在 X(Twitter 的前身,见 go.nature.com/3teexb1)上写了一篇关于如何将聊天机器人最好地用于商业目的的文章。例如,可以为一门课程创建一个自定义 ChatGPT,要求它始终根据所提供的课程材料来回答问题。


PinnedPinnedPrivate
belfercenter.org

在机场,我相信售票员、维修工程师和其他保持航空公司运营的人员。第三点,控制人工智能系统的公司将利用我们的困惑来占我们的便宜。不是对人工智能进行监管,而是对控制和使用人工智能的组织进行监管。当我们说我们信任一个朋友时,与其说是因为他们的具体行为,更多的是因为他们作为一个人。这个系统并不完美——总会有不值得信任的人——但大多数人大部分时间都是值得信任的,这已经足够好了。这是因为为了扩大规模,社会信任必须是有结构、系统和规则导向的,而这就是偏见嵌入的地方。因此,公司经常利用他们的顾客,虐待他们的员工,污染环境,并游说修改法律,以便能够更多地做这些事情。关于人工智能作为存在风险的问题已经有很多文章写过。AI并不是为了解决人类所有问题,或者去证明没有人能理解的数学定理,而是单纯地追求最大化生产的目标。


PinnedPinnedPrivate
lcamtuf.substack.com

关于一般兴趣在线社区的演变已经有很多文章写过。对于更专业、由专家领导的论坛的动态以及专业知识的独特但最终具有破坏性的作用,人们关注较少。这些论坛的成员人数从200人到20万人不等,托管在各种平台上,涉及的主题从电子电路设计到应急准备再到收藏古董等各种各样。几乎每一个例子都遵循相同的轨迹,因此今天,我想提出一个专家领导的社区的一般生命周期模型。大多数在线社区都以相同的方式开始:作为另一个不太专业的在线群体的分支,或者作为本地爱好者的临时论坛。例如,在COVID-19疫情爆发后,Reddit上的/r/preppers社区的规模增加了五倍。不受控制的增长最初受到欢迎,但很快变成了一个负担:源源不断的重复初学者问题使核心贡献者疲惫不堪。为了实现这个目标,经验丰富的成员制定了详尽的常见问题解答和严格的多页发布指南。于是开始了“新手狙击”的时期:对善意参与者进行嘲笑和归纳性惩罚,因为他们没有遵守协议。


PinnedPinnedPrivate
subconscious.substack.com

让我们仔细研究这七个印象,并探索构建仪式技术的含义。仪式 可以被看作是时间中重要形式的艺术,是时间的建筑。(查尔斯·泰勒在《世俗时代》中谈到仪式时间意识) 即使是小小的日常仪式,比如泡一杯咖啡、早晨冥想或每天写日记,也在我们的生活中创造了叙事结构。(潜意识,2023年,“在你的OODA循环中思考的工具”) 当我们不知道该做什么时,我们可以相信这个过程。仪式可以通过提供剧本来帮助我们走出僵局,当我们迷失方向时,可以按照剧本行事。(约翰·胡伊兹英加,《游戏人类》) 像所有的游戏一样,仪式需要暂时放下怀疑的态度。与游戏态度的关系(Salen, Zimmerman, 2004,《游戏规则》) 这就是为什么许多仪式都以参与开始。(约翰·胡伊兹因加,1938年,《 Homo Ludens》) 参与仪式活动时,你置身于一个神奇的领域,一个能够与你自己的深层联系起来的领域 (约瑟夫·坎贝尔,《上帝的神话与面具》) 在游戏研究中,这些世界中的世界被称为魔法圈。


PinnedPinnedPrivate
ourworldindata.org

要了解世界的现状,我们需要依靠其他手段:精心收集的全球统计数据。但是,我想提醒我们自己,仅仅通过人际交往,我们能了解到的社会信息是多么有限,而统计数据在帮助我们构建其他信息方面又是多么宝贵。美国的一项研究询问美国人知道多少人的名字,结果发现平均每人知道 611 个。全球统计数据不仅让我们看到了 "当今世界 "的面貌,还让我们看到了它的变化。对于那些主要依靠新闻来了解世界的人来说,记录世界变化的统计数据往往会让他们感到非常惊讶。虽然新闻的焦点绝大多数都集中在所有正在发生的问题上,但历史统计数据也让我们看到了正确的一面--世界已经取得的巨大进步。这幅图片说明了精心收集的全球统计数据的作用:它们照亮了我们周围的整个世界,让我们看到每个人身上发生的事情。为了实现这一目标,我们与专家交谈,阅读科学文献,分析现有数据,从而突出现有的最佳统计数据,并强调即使是最佳数据也存在的不足之处。


PinnedPinnedPrivate
theverge.com

是 SEO 毁了互联网还是谷歌毁了互联网不能只看表面答案,真正重要的是理解问题背后的机制、边界和现实代价。目标是告诉算法它需要听到的任何信息,以便网站在搜索结果中尽可能高地出现,利用谷歌所谓的客观性来吸引人们进入,然后通常向他们展示某种广告。随着时间的推移,SEO 技术已经传播并变得阴险,以至于现在用谷歌搜索任何东西都感觉就像在字典中查找“运动鞋”并找到一个听起来既不正确又可疑的定义,就好像它是由宣传耐克的人写的一样(“鞋类是让你就可以做到!” 今年,The Verge 正在探索 Google 搜索如何将网络重塑为机器人的栖息地,以及人工智能的出现如何威胁 Google 本身。他的 SEO 职业生涯始于 1994 年,当时 Google 还没有出现。” 达伦和达伦(发音相同)几十年来一直是朋友,从达伦·“D-Money”·布拉特在维加斯成人视频新闻奖期间举办说唱明星云集的互联网营销盛会开始,那时性爱网站是最受欢迎的网站之一技术先进,Daron Babin 正在使用 SEO 来推广离岸赌场和伟哥(“我们的排名超过了辉瑞!


PinnedPinnedPrivate
shruggingface.com

很明显,它完全不知道我是谁 使用LoRA (低资源适应)进行精细调整稳定扩散 太棒了,正如上面所示,我们可以很快生成一些整洁的图像,但是我该如何使用稳定扩散来生成我自己的图像呢?例如,DreamBooth需要很长时间来训练,并且它输出一个大型的多吉字节的模型检查点文件。LoRA的结果与DreamBooth相似,但它只需要5-7分钟的训练时间,而且它产生的权重文件更便携,只有10-15MB 。在MacOS上,你可以通过在 中选择图像文件来实现这一操作 要继续跟随,你首先需要前往Replicate并创建一个账户。总的来说,为你的Replicate上传文件使用描述性的文件名总是有帮助的,因为这将帮助你在查看结果时理解你正在看的内容。5 生成具有自定义稳定扩散LoRA权重的图像 太棒了,现在你已经得到了你的 权重文件,你可以用它来生成使用你的脸作为参考的图片!在Replicate上,如果你搜索公共模型中的“LoRA”,你会找到一些“有特色”的稳定扩散模型,这些模型将很好地配合你的LoRA权重。


PinnedPinnedPrivate
blog.normalcomputing.ai

在中,我们介绍了Branches,这是我们用于原型设计和可视化高级LLM推理和规划算法的工具。然而,一旦任务需要长期规划或最新的世界知识,LLM代理的表现就会急剧下降。要看到目标驱动的推理在行动中,可以看看这个演示,我们在其中展示了基于树的推理如何帮助模型解释和纠正错误的代码,同时解决HumanEval 3 基准测试。在中,我们关注一个特定的目标驱动AI示例,它使用基于树的方法,并通过Python解释器的反馈进行增强。分支:基于图形的目标驱动AI原型设计 在Normal Computing,我们相信让人类参与其中对于AI的长期成功和实用性至关重要。我们使用ToT范式来解决HumanEval数据集上的编码问题,用于Python代码生成。你可以在我们的交互式演示中探索应用于HumanEval的思维树推理过程。在这里,我们已经使得开发和评估LLM规划和推理算法的新方法变得可行。


PinnedPinnedPrivate
noahpinion.blog

爱尔兰是如何变得如此富有的不能只看表面答案,真正重要的是理解问题背后的机制、边界和现实代价。我刚刚参加完爱尔兰小城基尔肯尼(Kilkenny)一年一度的节日 "基尔肯经济"(Kilkenomics)。that rich. 这个国家很富有,但并没有那么富有。首先,也是最重要的一点,爱尔兰是著名的避税天堂--其低企业所得税率促使跨国公司将尽可能多的利润记入其爱尔兰子公司。对于欧洲公司来说,这通常需要将其业务活动实际迁移到爱尔兰,但美国有一个奇怪的企业税制,允许谷歌和苹果等公司采用各种其他计划在爱尔兰记账,而不在该国实际开展任何实质性活动,从而抬高了爱尔兰的国内生产总值。And despite getting hit正如《经济学人》所指出的,直到2000年,GNI\才真正开始与GDP背离,即使在2007年,背离也相当小。事实上,爱尔兰传统上比韩国更注重出口: 爱尔兰是一个小国,这意味着它不可能为国内市场生产很多东西,因为国内市场并不大。


PinnedPinnedPrivate
asteriskmag.com

但是,结肠镜检查也是昂贵的、侵入性的、不愉快的,而且很少(但也不是很少)会有严重的副作用。除结肠镜检查外,筛查结肠直肠癌的主要替代方法是 "隐血试验",它可以在粪便中发现诡异的隐血。胃肠道医生经常提到 "全国息肉研究",但这并不是真正的随机比较--该研究对所有受试者进行了结肠镜检查,并根据与其他 "类似 "人群的基础比率进行比较后得出结论,切除息肉是有帮助的。Cross 等人比较了英国疑似结直肠癌患者的乙状结肠镜检查和结肠镜检查,发现乙状结肠镜检查足以发现 80% 的癌症。北欧-欧洲结直肠癌倡议(NordICC)是一项大型随机试验,旨在严格衡量结肠镜检查能在多大程度上减少癌症和死亡。随后,研究人员对每个人(无论是否受邀、是否进行了结肠镜检查)进行了中位数为 10 年的跟踪调查,并查阅了政府记录,以了解哪些人被诊断出患有结直肠癌、死于结直肠癌或死于任何原因。一种回应是,这表明结肠镜检查并不划算,因为它对结肠直肠癌的死亡率只有很小的影响,并不比以前的微创筛查方法试验好多少。


PinnedPinnedPrivate
noahpinion.blog

由 Syria-Frames-Of-Freedom (Pro-FSA information) - 1, CC BY 2.0 提供 我注意到关于以色列-加沙战争的一些有趣现象,而这些现象似乎普遍被忽视了:这场战争并没有在整个中东地区蔓延的迹象。Cincotta 和 Weber(2021 年)发现,。在所有三种暴力形式中,"青年人口膨胀会增加政治暴力的风险 "这一预期都得到了有力的支持。从 1950 年到 2000 年收集的数据发现,15 至 24 岁人口占成年人口 35% 或以上的国家爆发国内冲突的可能性要高出 150%。Ibrahim(2019)等人也发现了类似的结果。与往常一样,该理论也有批评者,一些作者根据不同类型的冲突进行了区分--例如,Yair 和 Midownik(2014 年)声称,青年人口暴增与 "种族战争 "的相关性较低,而 Cincotta 和 Weber(2021 年)则提醒说,他们的结果较难检验 "分裂主义 "战争。