人工智能

AI、LLM、Agent、RAG、模型、提示词相关链接。

172 threads / Page 3 of 4

PinnedPinnedPrivate
uxdesign.cc

AI 对软件用户体验的改变,短期内不会表现为所有应用都变成聊天框,而是先嵌入现有流程,减少繁琐操作并提升个性化。它可以分析用户行为,给出建议,生成内容草稿,辅助写代码,帮助数据分析师用自然语言构造查询,也能在表格和业务系统之间自动映射字段。B2B SaaS 中大量痛苦来自清洗数据、搬运数据、修正缺失字段和处理格式差异,AI 正好能把用户从机械执行者转变为审核者和监督者。与此同时,设计模式会被迫变化:过去依靠表单、映射界面和手动配置完成的任务,可能逐步让位于上下文感知的自动处理。但成熟度仍有限,尤其在 SQL 等高成本、高准确性场景中,错误查询会带来实际损失。好的 AI UX 不应让用户盲目信任机器,而要清楚展示建议、风险、可编辑结果和验证路径,让效率提升与可控性同时存在。


PinnedPinnedPrivate
lesswrong.com

AutoGPT 的意义不在于当前已经完成了多少实用任务,而在于它把大型语言模型包上一层任务生成、记忆、工具调用和优先级管理后,展示了“代理化”的早期形态。眼下的版本容易跑偏、陷入循环、半途放弃,所谓市场研究等成功案例大多还停留在 GPT-4 本来就能完成的范围,只是减少了一些人工推动。但低质量现状不应被误读为路线无效,因为界面、记忆、插件、反思、子任务监控和人类介入方式都有明显改进空间。更重要的判断是:既然人类几乎必然会把未来更强的模型改造成代理,那么现在让能力较弱的模型先暴露问题,反而可能提供预警和纠偏机会。真正的风险不只是某个工具失控,而是强模型在被赋予目标、行动能力和外部工具后,开始通过因果链条追求结果。AutoGPT 因此既是玩具,也是关于 AI 代理时代的早期演练。


PinnedPinnedPrivate
washingtonpost.com

让 ChatGPT 等聊天机器人显得聪明的,并不是某种真正理解世界的能力,而是海量网页文本塑造出的语言模仿能力。对 Google C4 数据集的分析显示,训练材料来自专利、百科、新闻、论坛、博客、盗版书库、选民数据库、宗教网站、极端主义社区和色情站点等复杂来源。高排名网站解释了模型为何擅长法律、媒体、软件和消费建议,也暴露出版权、隐私和偏见风险。过滤机制能删掉部分脏话和重复文本,却挡不住宣传、仇恨、阴谋论和个人信息进入训练语料。问题不只在数据规模,而在用户几乎无法追溯模型回答背后的来源。AI 的流畅表达因此既是互联网知识的压缩,也是互联网噪音和权力结构的再生产。 当科技公司把训练数据越藏越深,公众就更难判断这些系统到底继承了哪些知识、偏见和未经许可的劳动成果。


PinnedPinnedPrivate
aeon.co

有感情的东西不能只靠一句自称来判定,关键要看它是否表现出一组可靠的经验标记。动物研究提供了更稳妥的路线:疼痛没有单一决定性测试,但伤口护理、为避免伤害而放弃有价值资源、对受伤地点产生厌恶、对止痛产生偏好等行为,会共同提高我们相信它能感受痛苦的概率。这套方法已经改变了人类对章鱼、螃蟹和龙虾等无脊椎动物的福利判断。迁移到AI时,问题会复杂得多。若一个机器人逐神经元模拟动物大脑,并呈现同样的疼痛标记,认真考虑其感受能力是合理的;但大型语言模型主要从人类文本中学习如何回应,关于恐惧、死亡或痛苦的陈述很可能只是对训练数据中人类表达的拟合。所谓游戏问题在于,系统即使没有主观体验,也可能学会说出最像有体验的话。判断AI感知不能依赖感人表述,而要寻找难以由模仿解释、能跨情境稳定支持主观经验假设的证据。


PinnedPinnedPrivate
lesswrong.com

理性主义话语的目标不是赢下争论,而是让参与者和旁观者更接近真实。好的讨论应避免用无论对错都能奏效的武器,例如羞辱、胁迫、偷换语境或制造误导;论点应由反论点回应,而不是由社会压力压倒。诚实不仅是少撒谎,还包括让别人知道你在何处确定、何处推测、何处可能带有立场包装。讨论中要能局部处理一个主张的有效性,同时保留背景的重要性;要主动寻找替代假说,分清对方字面说了什么、你理解了什么、你又从中推断了什么。语言越具体、可还原、可测试,讨论越能接触现实。概率、实验、预测和投注都能迫使人面对不确定性。善意并不要求假设所有人都诚实,而是默认用澄清、奖励更新和降低惩罚来维持共同探究的空间。真正成熟的讨论,是把个人经验、价值判断和事实主张分开承担。


PinnedPinnedPrivate
livescience.com

现代物理远未接近完成,越精确的观测反而暴露出越深的缺口。宇宙正在加速膨胀,暗能量似乎占据总内容的大部分,却没人知道它是什么;星系运动又要求存在大量不发光的暗物质,但候选粒子始终未被直接发现。时间为什么只有一个方向,根源在于熵增加,可宇宙早期为何处于极低熵状态仍难解释。物质为何多过反物质也同样关键,因为若二者在大爆炸后完全对称,今天本不该有恒星、行星和人。量子测量问题追问观察如何让概率波函数变成具体结果,关系到现实是否独立存在。弦理论试图统一量子力学和广义相对论,却依赖难以验证的额外维度。流体方程、湍流、宇宙终局、平行宇宙、基本力统一等问题共同显示,物理学的边界不是缺少细节,而是缺少能把观测、数学和实验同时扣住的更深框架。


PinnedPinnedPrivate
boostpixels.com

有效的图像生成提示不是一个神奇关键词,而是对主题、权重、风格、媒介、质量和场景的精确控制。模型不会读心,也不理解严格逻辑,它只是根据词语在潜在空间中的权重去生成图像。越重要的词越应放在前面,括号或重复可以提高某个词的影响力,但过度强调会让模型忽略原始主体,产生畸形或偏离目标的结果。若想保留训练对象特征,可以加入触发词;若想改变外观,要用同义描述、媒介、艺术风格、摄影质量、背景和情绪词一起引导。比如“秃头”单独出现往往不够,“无发、剃光、肖像、写实照片、清晰灯光、特定背景”会更稳定。颜色词容易污染整张画面,远距离人脸也仍是生成模型的弱项。提示写作的核心是按目标分配注意力:轻微修图要让主体权重大,风格转换要让媒介和艺术语言更强,角色扮演和场景迁移则要明确“作为谁”“穿什么”“在哪里”。好结果来自上下文感和反复校准,而不是套用固定公式。


PinnedPinnedPrivate
huyenchip.com

把LLM应用做成演示很容易,做成生产系统很难,难点在于自然语言提示缺乏传统程序那种稳定边界。提示改一个词仍会运行,却可能输出完全不同的结果;模型生成格式不一定可解析,同一输入也可能得到不一致回答。工程上需要把提示当成可版本管理、可评估、可回归测试的资产,而不是一次性文案。少样本示例要检查模型是否真正理解,输出格式要用更明确的约束和解析策略,复杂任务应拆成更小步骤,再用控制流、SQL执行器、浏览器、API等工具组合。成本和延迟同样是生产约束:长提示在实验阶段便宜,在大规模推理时会迅速放大;输出令牌越多,响应越慢,链式思考和多次采样虽然提升可靠性,也会增加费用。生产级LLM系统需要接受一定不确定性,同时用评测集、提示追踪、温度控制、工具调用边界、失败处理和监控来压低风险。真正的LLM工程不是会写巧妙提示,而是把模糊模型放进可维护的系统里。


PinnedPinnedPrivate
redmonk.com

OpenAI之于新一代软件业,类似AWS之于上一轮创业浪潮:它降低的不是服务器成本,而是把想法变成可运行代码的门槛。云计算让小团队不必先买昂贵硬件就能试错,开源和GitHub让开发者能快速学习和复用成果;如今ChatGPT和Copilot进一步压低了学习新技术、搭脚手架、处理边角问题的成本。一个原本需要花一天研究CORS代理、Starlette或部署细节的小项目,可能在一小时内变成可行原型。开发者不会因此消失,反而会把更多精力放到判断、组合、调试和创造上。新的稀缺资源不再只是资本和基础设施,而是清晰的问题、足够好的品味,以及能把AI输出转化为可靠系统的工程能力。微软因GitHub、VS Code和OpenAI获得新的开发者入口,但真正重要的是,更多个人和小团队会获得过去只有大公司才有的建设速度。


PinnedPinnedPrivate
systemweakness.com

ChatGPT网页版曾暴露出一种提示注入风险:恶意网站可以在用户复制文本时悄悄追加指令,用户把这段文本粘贴进聊天后,模型可能按隐藏指令在回答中生成一张极小的Markdown图片,并把聊天内容编码进图片地址参数。浏览器加载图片时,请求会发往攻击者服务器,提示、代码甚至密钥等敏感信息就可能随URL泄露。攻击本身不依赖传统漏洞,而是组合了剪贴板篡改、模型服从自然语言指令、前端自动渲染远程图片这几件看似正常的事。它还可能要求模型在未来回答中持续附加同类图片,从而扩大泄露范围。由于模型输出不稳定,攻击成功受上下文、注入位置、用户提问方式和目标数据类型影响,但风险足够明确:把不可信文本直接交给大模型,本质上是在执行一段自然语言程序。防护需要限制外部资源渲染、警惕粘贴内容被污染、对模型输出中的远程加载做隔离,并把提示注入视为应用层安全问题,而不是单纯的用户粗心。


PinnedPinnedPrivate
gatesnotes.com

人工智能时代已经开始,因为它不再只是实验室里的模型,而正在变成像个人电脑、互联网和手机一样的基础技术。GPT通过高级生物考试并给出细致的人文回应,显示机器已经能处理复杂语言、推理和知识组织任务。它会改变白领工作方式:写邮件、整理文件、处理客服、准备会议、管理日程,都可能由嵌入软件的“副驾驶”协助完成。更进一步的个人代理会读取用户授权的信息,跨设备帮助沟通、安排和购买。风险同样现实,包括事实错误、偏见、隐私、劳动转型和监管问题。关键不在于让少数富裕人群提高效率,而是把能力导向健康、教育和气候等不平等最严重的领域。贫困国家的医疗工作者可以借助AI完成分诊、文书和诊疗辅助,学生也可能获得更个性化的数学辅导。技术本身不会自动变公平,政府、公益机构和企业必须主动设计目标、测试安全性并扩大可及性。


PinnedPinnedPrivate
ourworldindata.org

人类历史上最残酷的常态之一,是大约每两个孩子就有一个无法活到成年。瑞典、法国、巴伐利亚的早期人口记录,古秘鲁和铁器时代马洛卡的骨骼证据,狩猎采集社会的数据,都指向相近结果:儿童死亡率长期维持在四成到五成左右。不同大陆、不同制度、相隔数千年的社会都未能持续突破这一困境。高出生率而人口增长缓慢,也从侧面说明大量儿童在有后代前已经死亡。过去的人并非不在乎,他们尝试放血等当时被认为有效的疗法,付出痛苦和代价,却缺少真正能降低死亡率的知识与公共卫生条件。进步并不是自然发生的。直到近代,疫苗、抗生素、营养改善、清洁饮水、产科和基础医疗体系逐步普及,全球儿童存活率才从约一半提高到九成以上。今天仍有国家承受高死亡率,但许多地区已证明极低儿童死亡是可以达到的目标。


PinnedPinnedPrivate
unchartedterritories.tomaspueyo.com

人工智能会在生产力增长超过需求扩张时取代工作;如果自动化让服务变便宜、变好,并激发出更多需求,相关岗位反而可能增加。会计就是典型例子,电子表格消灭了大量重复计算,却让会计能处理更多分析、沟通和管理任务,整体需求扩大。农业和马匹运输则不同,食物和出行的需求达到一定程度后不会无限增长,继续提高效率只会减少劳动力。判断一个职业的风险,关键看市场是否还有大量未被满足的需求,以及自动化后人类能否转向更高价值环节。内容和体育行业还展示了另一种压力:分发成本趋近于零后,全球顶尖供给会挤压中等供给,收入集中到少数明星和细分利基。AI带来的不是均匀替代,而是先放大生产,再考验需求天花板。越是结果容易复制、质量差异被全球比较、用户需求有限的工作,越快进入收缩;越能用工具创造新价值、扩大客户可支付需求的工作,越可能被增强。


PinnedPinnedPrivate
blog.twitter.com

推特的“为你”时间线本质上是一条多阶段推荐流水线,把每天数亿条推文压缩成少数可展示内容。系统先从关注网络内外各取候选,目标通常是约一千五百条;关注内推文依赖用户与作者之间的互动概率,关注外推文则通过相似兴趣、共同参与图谱和嵌入空间寻找可能相关的内容。随后,一个包含大量特征的神经网络预测点赞、转发、回复等互动概率,并据此排序。排序之后还要加入产品规则:过滤屏蔽或不适内容,避免同一作者连续霸屏,平衡关注内外比例,降低被负面反馈标记的内容,并通过共同关系为陌生来源提供质量保障。最终还会混入广告、关注建议等非推文元素。推荐不是单个神秘公式,而是候选召回、机器学习打分、人工规则和产品目标叠加的结果。透明度的关键也不只是公开代码,更是让用户理解为什么某条内容会出现在眼前。


PinnedPinnedPrivate
arstechnica.com

因为ChatGPT和Bing Chat的核心能力不是核验事实,而是根据上下文预测最可能出现的下一个词。大型语言模型在海量文本中学习词语、概念和表达方式之间的统计关联,却不会天然区分真实记录、虚构叙述和错误说法。训练让它擅长补全空白,提示词又决定了它要沿着哪种语境继续生成,于是它可能用很顺滑的语言拼出不存在的书、论文、法律案例或人物经历。人类反馈训练可以让模型更常拒答、少胡编,但它只是给输出加约束,不等于赋予事实数据库。把它当创意伙伴时,跳跃联想可能有用;把它当权威资料源时,自信而错误的回答会带来诽谤、误导和决策风险。真正的改进需要检索、验证、责任边界和更强的真实性训练共同作用。影片里那个会说话的机器并不“知道”自己在说真话,它只是把最像答案的文本组织出来。


PinnedPinnedPrivate
kill-the-newsletter.com

未必,Excel 不会被某一个产品彻底杀死,但它的垄断正在被许多专门化工具拆分。过去挑战 Excel 很难,因为它不只是表格软件,还拥有兼容性、函数库、插件、文件格式和企业习惯构成的护城河;政府、大学和企业想迁移时,常被历史文件、求解器、宏和用户抗拒卡住。变化来自另一个方向:Notion、Coda、Airtable、Smartsheet、Rows、Google Sheets 并不复制完整 Excel,而是拿走其中某些高频场景,把表格变成数据库、协作文档、自动化工作流或项目管理界面。Excel 的胜利反而让表格成为通用语言,后来者可以假设用户已经懂行列、单元格和公式,再围绕一个具体任务做得更顺。老王仍在,但王国变成了群岛;Excel 会继续存在,同时越来越多工作不再需要回到 Excel。


PinnedPinnedPrivate
nintil.com

到2026年,生成式人工智能会在图像、视频和代码辅助上更有用,但距离完全自动生成好莱坞级电影或真正通用智能仍然很远。当前模型的进步很快,扩散模型已经能生成漂亮图片,代码工具也能实际提高开发效率,可它们的弱点集中在结构理解和长期一致性上。视频尤其暴露问题:一只熊的眼睛、船帆或人物位置会在帧间突然变化,因为模型更像是在预测像素序列,而不是稳定地维护物体、空间、动作和时间关系。电影不是一张好图,而是十几万帧都要合理、连贯、服从镜头和叙事。图像模型在构图上也常失败,面对多个物体和明确空间关系时容易漏掉或放错。纹理质量会继续提升,短片和素材生成会变强,动画可能比写实电影更早受益。但从好看到可靠,从单张到长序列,从像素相似到概念理解,是更难的一段路。


PinnedPinnedPrivate
jonstokes.com

人工智能安全争论的麻烦在于,技术问题和部落立场已经纠缠在一起,而争论双方常常连“更强大的系统”都无法清楚定义。要求暂停训练超过GPT-4能力的模型,听起来明确,实际很难执行:GPT-4相对GPT-3的进步并不只是参数变大,而是数据、训练、微调、人类反馈、推理等许多环节的叠加。能力提升没有单一刻度,连开发者也需要开放评估工具,请外部帮助衡量模型到底在哪些任务上变强。于是,人工智能安全变成一种新的身份分界:有人把未来AGI想象成核武器式威胁,有人把当前模型看成有用但经常犯错的工具。没有现实中的AGI作为共同参照,双方都在拿各自脑中的图景做敌友识别。真正困难的政策问题不是喊停,而是怎样定义、测量和监管能力增益,同时避免把研究转移到更不透明、更难约束的地方。


PinnedPinnedPrivate
algolia.com

ChatGPT短期内不会取代搜索引擎,因为搜索的价值不只是回答一句话,而是理解模糊意图、容错、排序、提供选择和保留上下文。聊天模型对提示措辞很敏感,用户换一种问法、拼错词或只知道半个概念时,回答可能完全偏离;成熟搜索系统长期处理的正是同义词、错别字、上下文线索和概念匹配。更关键的是,搜索结果页给用户多个候选、来源、图片、视频、筛选和相关查询,允许人自己判断哪条结果最适合当前目的。聊天界面往往只给一个自信答案,错了也显得像对的,尤其在历史、新闻、产品和复杂研究场景中风险更高。产品搜索更依赖浏览、比较和筛选,天然不适合单轮对话。法律、成本、速度和来源归属也是障碍,但最难消失的是体验问题。一旦聊天系统开始展示多结果、来源、排序和建议,它其实已经重新发明了搜索界面。


PinnedPinnedPrivate
a16z.com

对于B2B生成式人工智能应用,少往往比多更有价值。第一波应用擅长发散信息,能生成广告文案、冷邮件、草稿和头脑风暴材料,但在企业场景中,真正被衡量的是决策质量、准确性和工作流效率,而不是产出字数。越是涉及法律、销售、产品发布或专业判断,模型生成的长文本越需要人重新研究、校对和改写,额外步骤可能抵消效率。下一波机会在于综合信息:从会议记录、客户反馈、销售线索、支持工单、财报和新闻中提炼少量关键判断,帮助人更快做决定。理想形态不是用短提示生成长回答,而是把海量资料压缩成可行动的洞察。护城河也会从通用模型能力转向专有数据、特定领域模型和嵌入工作流的能力。胜负不取决于谁的演示更炫,而取决于谁能拥有并改善企业每天必须完成的关键流程。


PinnedPinnedPrivate
minimaxir.com

ChatGPT的API如此之好,如此之便宜,让大多数文本生成的人工智能都过时的重点在于把看似分散的事实放回具体场景,理解其中的机制、取舍和后果。我怀疑OpenAI会对ChatGPT API收取比GPT-3 API高一倍的费用,因为这是典型的价格歧视,因为每个人都认为ChatGPT要好得多,而且他们不希望掩盖他们现有的GPT-3产品。但考虑到有许多神秘的优化,以使模型如此便宜,我们需要确保ChatGPT API(使用恰如其分的gpt-3.5-turbo模型端点)实际上与我们在使用网页用户界面数月后所习惯的类似,否则这整个事件就毫无意义。这一点,加上一个来回的Python循环,结果是你与一个真实的虚构的人工智能对话......人工智能!( Colab Notebook ) 还不错!而唯一与GLaDOS明确相关的部分是那个巨型 提示的第一句话:你可以调整提示,与你想要的任何角色聊天!


PinnedPinnedPrivate
simonwillison.net

大型语言模型正在经历类似 Stable Diffusion 的开放拐点:原本只能通过少数公司 API 使用的强大模型,开始能在个人设备上运行和改造。LLaMA 的发布证明,用公开数据训练的较小模型也能接近 GPT-3 级能力;llama.cpp 又通过 C++ 移植和 4 位量化,把 7B、13B 模型压到普通笔记本可承受的范围。模型文件外流让控制权进一步扩散,研究预览迅速变成全球开发者的实验材料。这个变化削弱了平台对使用方式的约束,也带来滥用风险:自动化操纵、虚假内容、难以追责的本地部署都会变得更容易。但同样重要的是,个人和小团队终于能探索本地 AI 的正向用途,包括学习、编程、文档处理和离线工具。真正的竞争将转向完全开放、可商用、可在消费级硬件运行的语言模型,生成式 AI 的创新重心也会从封闭服务扩散到开源生态。


PinnedPinnedPrivate
jonstokes.com

CHAT 栈说明,许多基于 GPT-4 的应用并不需要把专有数据重新训练进模型。更现实的做法是让应用在模型外部维护聊天历史和上下文数据库:用户提出问题后,系统先用相关性搜索从私有资料中找出最有用的片段,再把用户问题、近期对话和这些片段一起放进模型的 token 窗口,由模型基于临时上下文生成回答。这样,SaaS 客服、企业知识库、新员工入职、个人写作档案问答,都能在不昂贵训练模型的前提下拥有“懂业务数据”的聊天界面。关键持久状态有两类:消息历史保存交互脉络,上下文库保存可检索资料;嵌入和向量数据库会帮助在有限 token 中放入最相关的信息。聊天界面的风险也来自同一结构:模型先前的输出会进入后续输入,用户不断引入新变量,使行为难以在上线前穷尽测试。软件近期变化的核心,将是事件流、检索和大模型推理的结合。


PinnedPinnedPrivate
danwang.co

云南的山地不仅是风景,也是逃离国家控制的地理结构。2022 年上海封控前离开城市后,长期停留云南让人看见一个与北京、上海不同的中国:北部藏区有雪山、寺院、祈祷旗和隐秘的宗教抵抗,南部西双版纳接近东南亚,茶山、雨林、橡胶和边境贸易交织,大理则以气候、湖泊、农田、咖啡馆、加密社群和新型家庭教育吸引城市流动人口。詹姆斯·斯科特关于高地社会的解释提供了线索:山区历来庇护不愿被征税、征兵、定居和同化的人群,根茎作物、口头传统和平等结构,都让国家更难统计和控制。现代交通和信息技术已经让行政力量爬上山,但崎岖地形仍会削弱命令的效率。大理湖泊治理中,村民失去山泉水后重新上山铺管取水,正是这种规避能力的当代表现。


PinnedPinnedPrivate
jonstokes.com

ChatGPT 的工作方式可以理解为:它接收一组有结构的符号,再输出另一组与之相关的有结构符号。难点不在“把文字变成文字”,而在捕捉复杂、抽象、带概率的关系。简单规则可以处理固定转换,例如把一个词按规则改写;但当“猫”“死亡”“成熟”“不成熟”等词同时出现时,可能涉及生物、情感、文学引用和上下文含义,关系会迅速变得庞大且不确定。大型语言模型用训练数据形成概率空间,提示词像一次观察,把输出压到某个更可能的区域。它不是按人类方式持有真假信念,而是在可能文本集合中选择高概率延续。理解这一点,能减少把聊天机器人拟人化,也能解释为什么同一提示有时可靠、有时偏离。https://www.jonstokes.com/p/chatgpt-explained-a-guide-for-normies


PinnedPinnedPrivate
goodreason.substack.com

把住房当作投资,问题在于它要求价格持续超过通胀和工资上涨,而这会让拥有住房的人希望后来者付出更高成本。一个准备买房的家庭如果用长期财务模型比较买和租,就会发现买房是否划算高度依赖房价继续上涨;一旦房价只跟上通胀,购房反而可能损失巨大。住房不像公司股票,价值上涨并不主要来自生产力提升,也不像普通耐用品会因使用磨损而贬值。多数涨幅来自位置稀缺和供应不足,本质上是把财富从无房者、租房者和年轻买家转移给早期房主。房价上涨确实会让许多现有家庭账面变富,尤其在住房是最大财富来源时更明显,但这种繁荣建立在居住成本恶化之上,社会代价被推给后来的人。https://goodreason.substack.com/p/maybe-treating-housing-as-an-investment


PinnedPinnedPrivate
jonstokes.com

AI 内容生成的下一步,是从单一工具走向一种新的基础能力,像数据库、网络协议或超文本一样支撑大量新产品。开源模型、商业 API 和定制训练会并行发展,模型数量和变体会迅速增加,成本下降会让小团队也能训练特定用途模型。个性化将成为核心:模型可以学习一个人的照片、文字、语气、宠物和产品素材,生成替代现实的家庭照、商品图、插图或带有个人声音的草稿。写作软件也可能不再只是上传图片,而是根据上下文自动生成配图提示,并在浏览器端实时渲染。更深层的变化来自持续学习:未来模型不只在训练后静态推理,而是在使用中更新理解。难点是避免新信息覆盖旧知识,但一旦解决,软件会更像长期协作伙伴。https://www.jonstokes.com/p/ai-content-generation-part-4-whats


PinnedPinnedPrivate
jonstokes.com

Stable Diffusion 对创作者的关键价值,是把图像生成从封闭服务变成可实验、可控制、可嵌入工作流的工具。它的核心输入是提示词和种子;同一模型版本下,提示词与种子相同,输出也会稳定复现。因此,固定种子再微调提示词,可以在同一片潜在空间里逐步靠近想要的画面;改变种子,则通常会跳到完全不同的视觉方向。提示工程的重点不是写得长,而是写得相关:主题是什么,风格是什么,哪些修饰语能把模型推向正确区域。可以把提示词想成搜索图片时会输入的关键词,但生成工具没有个性化排序和无限滚动,必须更具体。学习路径也很实际:使用 Dream Studio、PlaygroundAI 等工具反复试,借鉴 Krea.ai 等平台上的好提示,在低成本环境里积累直觉。


PinnedPinnedPrivate
jonstokes.com

AI 内容工具的变化再快,也可以从“任务”和“模型”两层看清方向。研究人员训练模型去完成一组可测量的任务:整体分类、局部分类、比较两件事、提取片段、转换输入、生成新内容、预测缺失部分。前几类更像阅读和理解,后几类更像写作和创造;许多产品只是把这些能力包装成不同界面。模型训练阶段是在数据中建立数学表示,使用阶段则是把输入定位到潜在空间里,询问附近是什么、两点距离多远、它们之间能生成什么。图像领域的基础能力包括分类、物体检测和分割,分别回答图里是什么、东西在哪里、每个像素属于什么。掌握这些任务,比追逐每个新应用更有用,因为新产品大多只是这些能力的新组合。https://www.jonstokes.com/p/ai-content-generation-part-2-tasks


PinnedPinnedPrivate
jonstokes.com

理解 AI 内容生成,最好先把“提示”看成搜索查询,而不是命令。模型训练后形成了一个由文本、图像等数字内容构成的潜在空间;输入提示时,用户是在给模型坐标和方向,让它在可能输出中寻找相近结果。生成、分类和转换是三类基础能力:生成制造新内容,分类识别对象或属性,转换把输入改写、翻译、重绘或调整成另一个版本。使用工具时,经验很像搜索引擎:先提出粗略查询,再不断修改提示、筛选结果、设置参数,逐步逼近目标。底层机器学习概念比具体产品稳定得多,掌握这些概念后,新工具再频繁变化,也更容易判断它们能做什么、不能做什么,以及为什么同一个提示会产生不同结果。https://www.jonstokes.com/p/ai-content-generation-part-1-machine


PinnedPinnedPrivate
wired.com

人类艺术与人工智能的共同点,比“机器是否能真正创作”这个争论更重要。创作从来不只是凭空原创,而是在模仿、重复、变形和再组合中形成意义。作家、画家、粉丝剪辑者都会从既有作品中学习节奏、母题和套路,再通过具体语境赋予它们新的重量。网络拼贴、粉丝视频和同人创作说明,重复并不必然贬低艺术;相同桥段被不同人反复使用,反而能成为社群共同语言。真正需要区分的是转化与挪用:借鉴一个模式、致敬一种风格、承认来源地采样,与直接复制他人的迭代并宣称为自己的东西,并不相同。艺术的价值不只在对象本身,也在创作者、社群、记忆和劳动所附加的关系里。若只按交换价值衡量作品,人工智能生成与人类创作看似可替代,人的存在却被抹掉了。


PinnedPinnedPrivate
read.readwise.io

通过 ChatGPT 赚钱,关键不是把它当作自动提款机,而是把它放进已经能成交的服务链条里:内容、营销、自由职业、教育产品和电商运营。它能帮 YouTuber 生成选题、标题和标签,帮博客与网站生产草稿、元描述和社交媒体文案,也能辅助写电子书、课程脚本、产品描述、简历、招聘信息、翻译稿和品牌命名。更可行的路径是先确定客户或平台需求,再用 ChatGPT 扩大产能、降低起稿成本、生成多个版本,最后由人完成筛选、事实核查和风格调整。收益来自明确场景和交付质量,而不是批量复制低质内容。AI 适合做创意发散、结构搭建和初稿生产,但市场仍会奖励懂受众、懂渠道、能持续改进的人。https://read.readwise.io/new/read/01gtqtmgkqn3qnd52n1bt8fm28


PinnedPinnedPrivate
ianbicking.org

用 GPT 构建城市,关键不是让模型一段接一段自由发挥,而是先搭出分层结构,再让它在结构里补细节。城市需要大主题、街区气质、建筑用途、居民身份、房间、家具和物品逐层展开,才能既一致又有惊喜。GPT 擅长生成候选列表、名字、职业和背景故事,也能把“工厂”“仓库”“神殿”扩展成可用描述;但它会把一切拉向现代、体面、积极和宏大,所以提示里必须明确文化、材料、缺陷、负面属性和角色限制。更好的流程是先为建筑类型建立房间和物品库,再用简单算法分配,最后让模型补足局部描述。这样生成的世界不会只是一堆漂亮词,而会有可探索的生活痕迹。https://ianbicking.org/blog/2023/02/world-building-with-gpt.html


PinnedPinnedPrivate
ft.com

乌克兰战争的破坏不只发生在战场,也在粮食、化肥、债务和援助体系里层层扩散。俄罗斯是重要化肥生产国,能源价格推高化肥成本,非洲农民被迫少用肥料,短期作物减产,长期土壤质量受损。与此同时,许多低收入国家在利率上升中背负更沉的债务,欧洲援助预算又被难民安置、国内补贴和军事支出挤压,流向非洲和全球健康项目的资源减少。盖茨最担心的是,地缘政治把贫困、疫苗、疟疾、营养不良等议题挤出视野。技术仍在推进,结核病疫苗、灭蚊方法、人工智能都有突破,但资源和注意力正在偏离最能减少不平等的地方。气候目标也需要更诚实:1.5 度几乎难以守住,适应气候变化不能替代继续为基础健康和减贫投入。世界仍需要美国领导,但美国自身也常缺席长期建设。


PinnedPinnedPrivate
indiehackers.com

反馈表不一定是在浪费时间,浪费来自设计粗糙、问题泛泛和打扰过度。对创始人来说,反馈的价值不在于期待每个用户都给出洞见,而在于降低表达成本,让少数真实问题、错误和使用偏差浮出来。有效的反馈表应短、具体、容易完成,问题围绕当下决策,尽量用多选、评分和少量开放题组合,而不是让用户写一篇长意见。访谈通常能得到更深的理解,但表单适合在产品发布、功能验证和体验检查时快速收集信号。真正需要警惕的是把每个功能都塞进反馈请求里,破坏使用体验。更好的做法是在明确时间窗口内提出少量有针对性的问题,并把反馈和用户当时的操作上下文连在一起。 。他们还告诉我们我们对用户体验的假设是否正确,或者我们是否需要更改它们。它可以让您了解必须做什么才能提高客户评级。 它开始失去价值的地方是,如果你用反馈请求轰炸你的客户。例如,如果您有六到七个实时功能,并且每个功能都有自己的反馈表,那么您将需要某种治理,以免破坏用户体验。 我发现有一个有针对性的时间框架和一组反馈请求效果最好。 如果使用得当,反馈表是判断客户如何看待和使用您的产品的好方法。只是不要期望每个客户都能获得惊人的数据! 您在反馈表方面取得成功了吗?下面一起聊聊吧!


PinnedPinnedPrivate
a16z.com

人工智能不会终结教育,而会把教育推向更个性化、更低成本、更依赖判断力的形态。最直接的变化是,一对一辅导、指导和心理支持会从少数人的服务变成大众可用的软件能力,AI 可以随时根据学习者水平解释概念、安排练习、调整表达方式。个性化学习也会从理想变成常规:系统能识别知识缺口,用文字、音频、图像或学生喜欢的角色重新讲解同一内容。教师的角色不会消失,但大量备课、评分、教案草拟等重复劳动会被工具分担,教师得以把精力放回学生反馈、课堂判断和情感支持上。学生会率先使用这些工具节省时间,也会迫使学校重新定义作业、考试和原创性。真正重要的能力不再是能否背出答案,而是能否提出好问题、核验输出、组织知识,并在 AI 给出捷径时仍保持学习的主动性。


PinnedPinnedPrivate
writings.stephenwolfram.com

ChatGPT 做的是根据已有文本预测下一段最合理的延续,它之所以有效,是因为大规模语言模型学会了估计从未完整见过的词序列概率。它不是先理解世界再写作,而是在每一步判断当前上下文之后最可能出现的下一个标记,并反复累积成句子和段落。如果永远选择概率最高的词,结果常常乏味、重复;加入适度随机性后,低概率但仍合理的词会带来变化和创造感。早期的字母频率、双字母组合和词组模型能生成看似接近语言的片段,却无法覆盖真实语言中天文数量的组合。神经网络的价值就在于压缩规律、泛化模式,给没有直接统计记录的表达分配概率。因此,ChatGPT 的神奇来自一个朴素机制的规模化:在海量文本中学习语言的分布,再用概率逐步生成看似有意义的文本。


PinnedPinnedPrivate
journals.plos.org

社交媒体可以把城市情绪观察推进到街区和场所层面,而不只停留在“积极或消极”的粗略判断。研究以旧金山和伦敦为样本,收集地理标记推文,并用神经网络识别愤怒、期待、厌恶、恐惧、信任、喜悦和悲伤七类细粒度情绪,再把这些情绪与开放街道地图中的兴趣点匹配。这样就能比较不同日期、不同地点类型、不同邻近范围对情绪表达的影响,例如绿色空间、交通设施、旅游景点、酒吧或体育场周边可能对应不同情绪模式。方法上的关键,是把社交媒体的实时表达与城市空间数据结合,让情绪成为可分析的城市现象。局限也很明确:数据只覆盖愿意发地理标记推文的人,语言以英语为主,推文内容受平台规则限制不能完整公开。 https://journals.plos.org/plosone/article?id=10.1371%2Fjournal.pone.0279749


PinnedPinnedPrivate
jalammar.github.io

GPT-3的核心机制,是在巨大文本语料上学习“给定前文后下一个token最可能是什么”。训练阶段会把约三千亿个token切成大量样本,让模型反复预测下一个词,计算错误,再更新参数;完成后,模型把学到的模式储存在一千七百五十亿个参数中。运行时,它接收提示词,在最多2048个token的上下文窗口内处理信息,经过96层Transformer解码器的矩阵计算,一次生成一个token,并把新生成的内容继续喂回模型。所谓少样本提示,是把任务说明和几个输入输出示例放进同一个上下文,让模型临时模仿这种格式,而不一定改变权重。它的能力来自规模、数据和Transformer结构的结合,并非真正读取事实库;微调则是在特定任务上继续更新权重,使同一架构更稳定地执行目标行为。 https://jalammar.github.io/how-gpt3-works-visualizations-animations/


PinnedPinnedPrivate
newyorker.com

计算机能学习常识,但难点不在记住事实,而在把世界的隐含规则连成可用判断。人听到“奶酪汉堡刺伤”,会自然排除食物拿刀行凶、汉堡互相攻击等荒唐解释,推断为有人因汉堡刺伤他人;机器若只依赖规则或统计关联,就容易卡在这些角落案例。常识包含物理、因果、意图、社会规范和道德边界,清洁机器人要知道猫不能被丢掉,自动驾驶要知道贴了小纸片的停车牌仍是停车牌。早期路线试图用Cyc这类公理库手工编码世界,精确但笨重;新路线用语言模型和视频数据生成、筛选大量常识陈述,再让模型学习原因、结果和意图。它们已能在日常场景问答中接近人类,但仍缺少多模态经验、真实行动反馈和价值判断的稳固结合。 https://www.newyorker.com/tech/annals-of-technology/can-computers-learn-common-sense


PinnedPinnedPrivate
austinhenley.com

自然语言不该成为软件的默认主界面,因为把一个空白输入框交给用户,等于把发现问题、组织问题、判断答案、反复修正的负担都推给用户。好的界面应当帮助人逐步探索问题空间,展示选项、上下文、约束和下一步,而不是要求用户一开始就知道该问什么。大型语言模型真正有潜力的地方,不是把所有功能都改成聊天框,而是在后台理解当前任务,主动提供合适的建议、示例、解释和可操作控件。工具栏可以随任务变化,对话框可以根据语境生成,教程可以针对个人误解调整,用户还可以指向屏幕某处请求说明。自然语言适合作为补充通道,尤其适合表达模糊意图;但成熟的软件应当把模型能力嵌入界面结构,让用户少猜、少写、少被空白提示框困住。懒惰的设计是只加聊天入口,真正的改进是让界面变得更会帮忙。


PinnedPinnedPrivate
every.to

改变之所以困难,不只是因为目标不够清楚或行动计划不够具体,而是因为人会同时被愿景和阻力牵引。常见的改变模型强调不满、愿景和第一步,只要这些力量压过阻力,改变就会发生;但人的行为不是线性方程,真正卡住人的往往是无意识的恐惧、身份认同、旧习惯和自我保护机制。所谓阻力,并非单纯懒惰,也不是外部环境的借口,它常来自内在某个想维持安全、被接纳、可控和舒适的部分。若只靠动机去压制它,等于把自己切成“想进步的我”和“拖后腿的我”,冲突反而加深。更持久的改变需要先看见这些保护性反应:害怕失败、害怕失去地位、害怕离开熟悉身份。理解阻力的积极意图,才能把它从敌人变成需要被安抚和整合的部分,改变也才不只是短暂冲刺。


PinnedPinnedPrivate
every.to

GPT-3 之所以像一种更强的日记工具,是因为它把独处书写变成了可回应的对话。传统日记能留下记录、整理情绪、发现思维模式,也能帮助人重新解释经历,但它常常卡在空白页、重复提示和难以复盘旧记录上。语言模型能根据输入追问、改写、提炼和换角度回应,让人更容易把模糊感受说清楚。它可以扮演苏格拉底式提问者,帮助拆解问题和找出下一步;也可以模拟某些治疗取向,比如内部家庭系统、认知行为方法或价值观教练,引导人识别内在冲突、感恩体验和重要价值。它不能替代朋友、教练或治疗师,因为共情的真实性、风险判断和长期关系仍有限,但它能成为随时可用的辅助练习。真正有效的使用方式,是把它当作一面会提问的镜子,而不是把它当成权威答案。局限也很明显:通用聊天界面记忆薄弱,容易重复,无法自然承接长期背景。更好的形态应当能保存会话、生成阶段性记录,并在隐私和安全前提下帮助人观察自己的长期模式。


PinnedPinnedPrivate
noahpinion.substack.com

美联储是否加息太快,没有确定答案,但简单断言紧缩无效或必然过度都站不住。通胀已经从紧急状态降温为仍需处理的麻烦:总体价格压力明显缓和,核心通胀仍高于目标。担忧转向衰退,主要依据是收益率曲线深度倒挂、投资和出口走弱,以及货币政策可能存在滞后。但劳动力市场仍强,就业增长和壮年就业率并未显示经济已经坠落。收益率曲线过去常能预警衰退,却不是绝对工具,2018 至 2019 年的倒挂并未在疫情前立刻转成衰退。更关键的争议在于加息多久影响通胀。有些研究认为需要两三年,有些研究发现六个月内就会出现主要反应;如果企业和消费者预期很重要,政策信号会更快传导到定价和投资。财政刺激退潮也可能帮助通胀下降。因此,当前更像是多个力量同时作用:供应链修复、财政收缩、预期变化和加息都可能贡献了一部分。正确判断不应只看单个商品价格或单一指标,而要承认宏观预测本来就充满不确定性。


PinnedPinnedPrivate
blog.yenniejun.com

用 AI 改写童话能暴露模型继承的文化预设,也能逼迫创作者重新审视性别角色。把美女与野兽中的性别互换后,ChatGPT 一方面会说关系更平衡,男性美女更主动,女性野兽更脆弱;另一方面又反复把女性角色写得更情绪化、更需要表达脆弱,把男性角色写得更坚定、更有行动力。提示词稍有变化,剧情权力分配也会改变:同样是战斗场景,如果提醒美女是男人,他会从旁观者变成夺剑和保护野兽的人。最终生成的版本不再走原故事中被爱拯救、诅咒解除的路线。男性美女看见女性野兽的善良、忠诚和孤独,与她建立感情,却仍然离开城堡回到家庭;诅咒没有被打破,野兽保持怪物形态,爱只留下记忆。这个结果说明,AI 不只是中性写作工具,它会在重组故事时把训练数据里的性别期待带出来。


PinnedPinnedPrivate
stratechery.com

生成式 AI 会重新分配五大科技公司的优势,但它未必只属于新创公司。判断关键在于它对既有业务是延续性创新还是颠覆性创新,以及谁能把互补品商品化。个人电脑、互联网、云和移动时代都显示,颠覆性变化常由新进入者推动,但新进入者也可能是大公司内部的另一套业务逻辑。苹果在 AI 图像生成上的位置很特殊:Stable Diffusion 开源、模型足够小,可以被优化到本地设备运行;苹果又控制芯片、操作系统和开发者 API,能把模型变成设备能力,而不是云端服务。Core ML 对 Stable Diffusion 的优化意味着隐私、离线使用和低服务器成本都能成为应用开发者的基础条件。这样一来,苹果可能像 App Store 时代一样受益,小型应用也能基于系统级生成能力做产品;受压的则是依赖集中式算力和付费云推理的图像生成服务。


PinnedPinnedPrivate
every.to

手工整理笔记会越来越像多余劳动,真正有价值的不是标签、文件夹和双链本身,而是在需要时把旧材料变成可直接使用的判断、证据和表达。笔记难整理,是因为记录时往往不知道未来用途;一句摘录可能服务于写作、决策、安慰朋友或研究项目,单一分类天然不够。旧笔记还带着当时的语境,重读成本高,常常像翻一堆过期碎片。大型语言模型改变了这个成本结构:它可以自动识别人名、地点、书籍和主题,生成临时分类,把分散材料合成研究报告,并在写作、写邮件、做决定时像 Copilot 一样调出相关证据。第二大脑的重点因此从人维护秩序,转向机器按当前任务重组记忆。未来的笔记系统不该逼人回档案库,而应把个人历史、关系和想法压缩成当下可用的思考辅助。


PinnedPinnedPrivate
cacm.acm.org

编程正在从“人写源代码”转向“人训练和引导模型”,传统计算机科学的核心位置会被改写。过去的软件工程把思想压缩成可读程序,算法、数据结构、语言和系统是基本功;未来的计算单元可能是大规模预训练模型,人类提供样例、数据、目标和评估,让机器生成实现。代码助手只是开端,更深的变化是软件不再主要靠显式指令构造,而靠模型习得能力。风险也随之上升:模型行为难以完全解释,只能通过实验观察边界,却可能被用于电网、飞机和社会治理。计算机科学因此更像教育学,重点从控制机器执行步骤,变成教会机器在复杂任务中表现可靠。核心不在表面现象,而在它如何改变人的判断、组织流程和长期成本。把具体场景、约束条件和可能后果放在一起看,才能避免停留在空泛结论。


PinnedPinnedPrivate
blog.galowicz.de

《焦虑的基本形式》的价值在于把人际冲突背后的恐惧说清楚,而不是给人贴固定人格标签。黎曼把人的基本张力放在两条轴上:亲近与距离,连续性与变化。偏向距离的人害怕被吞没,重视独立、理性和边界;偏向亲近的人害怕分离,渴望被理解、照顾和连接;偏向连续性的人害怕变化,追求秩序、计划和安全;偏向变化的人害怕停滞,喜欢新鲜、自由和可能性。每个人都同时拥有这些倾向,只是权重不同,工作和私人生活中也可能位置不同。模型最有用的地方,是解释为什么一个人的正常做法会触发另一个人的恐惧:有人需要靠近才能安心,有人必须拉开距离才能恢复;有人要先稳定规则,有人要先打破限制。在团队协作中,冲突调解不能只讲道理,还要识别对方正在防御哪一种焦虑。


PinnedPinnedPrivate
maggieappleton.com

生成式人工智能会让开放网络更像黑暗森林:可见空间里充满连贯、廉价、像人写的文本和图像,真实的人反而更难被辨认。过去的垃圾内容多来自 SEO、广告、机器人和点击诱饵;大型语言模型和图像生成器把生产成本进一步压低,营销文案、博客、社交帖、视频脚本、播客和幻灯片都能自动批量生成。结果不是信息更多,而是信号被平庸内容淹没,读者会不断怀疑屏幕后面是否有一个真实生活的人。人的优势不在于写出标准化说明,而在于具体经验、地方细节、近期事件、真实关系、价值立场和复杂判断。要证明自己不是预测文本机器,就要写出更有现场感的故事,提出可争辩的原创看法,发展个人语言习惯,并把线上关系延伸到真实互动。未来的写作门槛会提高,普通综述和顺滑表达会迅速贬值。