Archive
April 202347 threads
数据驱动的决策并不是创新的决策数据驱动的决策通常擅长优化已有市场,却很难产生真正创新。焦点小组、调查、客户分群和行为数据主要来自已经被互联网服务覆盖的人群,他们的未满足需求往往只剩细小改进空间。早期的eBay、亚马逊和iPhone打破市场,并不是因为更精细地服务既有需求,而是满足了当时主流方案无法满足的需求:陌生人可信交易、可靠线上物流、可随应用变化的触控界面。创新机会更常出现在技术边缘的人那里,包括被忽视的群体、残障用户、没有被现有产品认真服务的人。服务这些人并不必然牺牲大众市场,许多无障碍能力后来成为所有人都受益的核心功能。团队要发现这类机会,不能只收集现成数据,还要练习让不同声音进入决策:主持会议、主动征求反对意见、正确归功、尊重专业经验、把分歧变成探索。创新不是少看数据,而是承认数据只能照亮已经有人走过的地方。
人工智能的下一个领域:建立并投资于大型语言模型大型语言模型正在成为生成式人工智能最重要的基础设施,因为语言连接着知识、工作流和几乎所有行业的信息交换。Transformer架构让模型训练更高效,GPT、BERT、XLNet等系统由此发展,ChatGPT则把多年积累推到大众面前。真正的商业价值未必只来自最大的通用模型,而更可能来自面向特定领域和任务的专用模型。通用模型覆盖面广,但推理成本高、内存占用大,在银行、医疗、客服、法律等场景里还需要更强的一致性和政策理解。企业可以在公开基础模型之上,用行业数据和自身业务记录继续训练,让模型学会具体规则、语气和流程。提升能力主要有三条路:改进架构、扩大模型规模、增加训练数据。规模变大能增强表达和建模能力,但成本也随之上升,因此很多应用会选择较小基础模型加专业化训练。竞争优势不只是拥有模型,更是拥有数据、场景、分发和把模型嵌入真实业务的能力。
与Steve Yegge讨论开发者生产力的全貌开发者生产力的全貌不只是写代码更快,而是工具、组织执行和客户意识共同塑造工程效率。Steve Yegge的经历把这条线串起来:在GeoWorks,他见到极强的调试器、脚本工具和轻量自动化,即使用汇编写操作系统,工程师仍能高效而愉快;在亚马逊,他从技术项目管理学到跨团队交付,理解客户服务工具必须横向连接所有系统,这种压力后来也推动了服务接口和平台化思维;在谷歌,他看到强大工程文化的另一面,工具和流程可能很先进,却也可能离真实客户过远。真正的生产力不是单点技巧,而是让工程师少受摩擦、让系统边界清晰、让团队能围绕客户问题快速协同。优秀开发工具的价值常常在失去后才显现,因为它们改变的是日常判断和反馈速度。一个工程组织若只谈个人能力,不建设调试、发布、服务接口和跨职能协作,就很难持续放大开发者的产出。
进化如何使人类更像鸟类而不是其他哺乳动物人类在繁殖和育儿上更像鸟类,而不像多数哺乳动物,关键原因是巨大大脑和直立行走共同制造了进化妥协。哺乳动物通常能把胎儿留在体内更久,出生时更成熟,大象幼崽很快能站立跟随母亲。鸟类受蛋的容量限制,许多聪明鸟类只能孵出极不成熟的幼鸟,再由父母长期喂养。人类也陷入类似处境:婴儿头颅必须穿过受双足行走限制的骨盆,不能等大脑充分发育后再出生。于是人类婴儿长期无助,童年漫长,养育高度依赖合作。这不是进化的完美设计,而是智慧、手部灵巧、身体结构和繁殖风险之间的权衡。所谓人类特殊性,并不只在大脑,也在这种代价高昂的育儿模式。鸟类经验反而更能解释人类为何如此聪明、脆弱、依赖家庭与社会。辛苦的分娩和漫长的照护,不是附带现象,而是人类演化路线的一部分。
人工智能时代已经开始|比尔-盖茨人工智能时代已经开始,因为它不再只是实验室里的模型,而正在变成像个人电脑、互联网和手机一样的基础技术。GPT通过高级生物考试并给出细致的人文回应,显示机器已经能处理复杂语言、推理和知识组织任务。它会改变白领工作方式:写邮件、整理文件、处理客服、准备会议、管理日程,都可能由嵌入软件的“副驾驶”协助完成。更进一步的个人代理会读取用户授权的信息,跨设备帮助沟通、安排和购买。风险同样现实,包括事实错误、偏见、隐私、劳动转型和监管问题。关键不在于让少数富裕人群提高效率,而是把能力导向健康、教育和气候等不平等最严重的领域。贫困国家的医疗工作者可以借助AI完成分诊、文书和诊疗辅助,学生也可能获得更个性化的数学辅导。技术本身不会自动变公平,政府、公益机构和企业必须主动设计目标、测试安全性并扩大可及性。
过去的死亡率:每两个孩子都会死亡人类历史上最残酷的常态之一,是大约每两个孩子就有一个无法活到成年。瑞典、法国、巴伐利亚的早期人口记录,古秘鲁和铁器时代马洛卡的骨骼证据,狩猎采集社会的数据,都指向相近结果:儿童死亡率长期维持在四成到五成左右。不同大陆、不同制度、相隔数千年的社会都未能持续突破这一困境。高出生率而人口增长缓慢,也从侧面说明大量儿童在有后代前已经死亡。过去的人并非不在乎,他们尝试放血等当时被认为有效的疗法,付出痛苦和代价,却缺少真正能降低死亡率的知识与公共卫生条件。进步并不是自然发生的。直到近代,疫苗、抗生素、营养改善、清洁饮水、产科和基础医疗体系逐步普及,全球儿童存活率才从约一半提高到九成以上。今天仍有国家承受高死亡率,但许多地区已证明极低儿童死亡是可以达到的目标。
人工智能何时会取代你的工作?人工智能会在生产力增长超过需求扩张时取代工作;如果自动化让服务变便宜、变好,并激发出更多需求,相关岗位反而可能增加。会计就是典型例子,电子表格消灭了大量重复计算,却让会计能处理更多分析、沟通和管理任务,整体需求扩大。农业和马匹运输则不同,食物和出行的需求达到一定程度后不会无限增长,继续提高效率只会减少劳动力。判断一个职业的风险,关键看市场是否还有大量未被满足的需求,以及自动化后人类能否转向更高价值环节。内容和体育行业还展示了另一种压力:分发成本趋近于零后,全球顶尖供给会挤压中等供给,收入集中到少数明星和细分利基。AI带来的不是均匀替代,而是先放大生产,再考验需求天花板。越是结果容易复制、质量差异被全球比较、用户需求有限的工作,越快进入收缩;越能用工具创造新价值、扩大客户可支付需求的工作,越可能被增强。
医疗保健市场平台,你在哪里?医疗保健市场平台之所以少见,是因为医疗交易不像打车或订房那样只有买卖双方。病人、医生、保险方同时参与,价格、档期、资格判断和报销规则都不透明,很多服务又是低频需求,获客成本很难摊薄。心理健康成为少数跑通的品类,是因为需求在疫情后快速增长,远程服务被广泛接受,治疗师过去普遍不接保险,而保险公司又急需扩展心理健康网络。平台替治疗师处理签约、账单和支付,帮助他们获得更多客户,也让患者降低自费成本,于是双方都有留下来的理由。这个模式能复制到其他医疗领域,但前提是平台必须真正解决供给端的痛点,而不只是做信息黄页。可行路径包括聚合高质量服务者,提供排班、沟通、转诊等轻量软件,接入保险和支付轨道,再建立可靠的需求获取能力。医疗市场的核心难题不是流量,而是信任、资格、支付和长期关系。
采访你的产品的潜在用户的7个关键问题优秀的用户访谈不是问对方想不想要某个产品,而是逼近他们真实做事的过程、痛点和代价。第一步要让潜在用户复盘最近一次具体经历:当时发生了什么、他们怎么处理、为什么那样处理。接着确认现有办法里哪些地方有效,避免把所有现状都误判为问题。痛点要追问到最糟糕的部分,以及到底有多糟,只有强痛点才可能支撑新产品。成本同样关键,包括花的钱、时间、协调精力和失败后的损失。还要问他们经历过的最好方案是什么,用来理解理想标准。最后再让用户想象如果有“魔法棒”会修复什么,并拿自己的方案假设去测试哪些环节真的有帮助、哪些没有。这样得到的不是泛泛偏好,而是可验证的使用场景、购买动机和产品边界。用户不会替你设计产品,但会暴露他们愿意为什么改变行为。
推特的推荐算法推特的“为你”时间线本质上是一条多阶段推荐流水线,把每天数亿条推文压缩成少数可展示内容。系统先从关注网络内外各取候选,目标通常是约一千五百条;关注内推文依赖用户与作者之间的互动概率,关注外推文则通过相似兴趣、共同参与图谱和嵌入空间寻找可能相关的内容。随后,一个包含大量特征的神经网络预测点赞、转发、回复等互动概率,并据此排序。排序之后还要加入产品规则:过滤屏蔽或不适内容,避免同一作者连续霸屏,平衡关注内外比例,降低被负面反馈标记的内容,并通过共同关系为陌生来源提供质量保障。最终还会混入广告、关注建议等非推文元素。推荐不是单个神秘公式,而是候选召回、机器学习打分、人工规则和产品目标叠加的结果。透明度的关键也不只是公开代码,更是让用户理解为什么某条内容会出现在眼前。
为什么ChatGPT和Bing Chat如此善于编造故事?因为ChatGPT和Bing Chat的核心能力不是核验事实,而是根据上下文预测最可能出现的下一个词。大型语言模型在海量文本中学习词语、概念和表达方式之间的统计关联,却不会天然区分真实记录、虚构叙述和错误说法。训练让它擅长补全空白,提示词又决定了它要沿着哪种语境继续生成,于是它可能用很顺滑的语言拼出不存在的书、论文、法律案例或人物经历。人类反馈训练可以让模型更常拒答、少胡编,但它只是给输出加约束,不等于赋予事实数据库。把它当创意伙伴时,跳跃联想可能有用;把它当权威资料源时,自信而错误的回答会带来诽谤、误导和决策风险。真正的改进需要检索、验证、责任边界和更强的真实性训练共同作用。影片里那个会说话的机器并不“知道”自己在说真话,它只是把最像答案的文本组织出来。
最好的公司如何衡量内容质量内容质量不能只看流量、停留时间或发布篇数,因为这些数字往往只告诉你结果,不告诉你该改什么。高增长团队要先区分两类内容:绩效内容承担搜索、转化、推荐流量等目标,编辑内容承担立场、叙事和品牌表达。前者必须用可控、可行动、带业务背景的指标衡量,例如主题覆盖是否完整、可读性是否达标、拼写语法错误是否减少、搜索意图是否匹配;后者则不应被硬塞进 SEO 指标。规模化生产的风险是质量下滑,尤其在生成式 AI 让低成本内容激增之后,平庸内容会更快淹没网络。真正有效的体系会覆盖生产、表现和维护三个阶段:写作时看输入质量,上线后看业务结果,进入稳定期后用同比表现和排名变化决定是否刷新。数量只有在质量守住时才会放大增长,否则只是更快制造无效页面。
Excel的终结者?未必,Excel 不会被某一个产品彻底杀死,但它的垄断正在被许多专门化工具拆分。过去挑战 Excel 很难,因为它不只是表格软件,还拥有兼容性、函数库、插件、文件格式和企业习惯构成的护城河;政府、大学和企业想迁移时,常被历史文件、求解器、宏和用户抗拒卡住。变化来自另一个方向:Notion、Coda、Airtable、Smartsheet、Rows、Google Sheets 并不复制完整 Excel,而是拿走其中某些高频场景,把表格变成数据库、协作文档、自动化工作流或项目管理界面。Excel 的胜利反而让表格成为通用语言,后来者可以假设用户已经懂行列、单元格和公式,再围绕一个具体任务做得更顺。老王仍在,但王国变成了群岛;Excel 会继续存在,同时越来越多工作不再需要回到 Excel。
蒂姆-库克谈塑造苹果的未来蒂姆·库克塑造苹果的方式不是复制乔布斯,而是用克制、秩序和长期主义管理一家极端庞大的创造型公司。他每天清晨阅读用户邮件,把抱怨、感谢和生活故事转给相关团队;随后训练、开会、提问,避免让紧急事务吞掉整天。他的领导气质不靠冲突和戏剧性,而靠持续追问一件事是否讲得清、是否足够深。接替乔布斯后,库克面对的核心压力是既守住苹果已有的文化和产品标准,又证明苹果仍能产生未来。Apple Park 也体现了这种取向:建筑不以纪念碑自居,却用空间鼓励合作、开放和安静。外界常把库克简化为运营专家,但苹果在他任内市值大幅增长,服务、可穿戴设备和隐私立场成为公司新版图。真正的变化在于,苹果从个人天才神话转向一套能持续产出高标准产品的组织系统。
How Complex Systems Fail复杂系统失败通常不是单个错误造成的,而是许多平时看似无害的小故障在特定时刻叠加。交通、医疗、发电这类系统天然带有危险,因此才会发展出备份、流程、培训、监管等多层防线。灾难发生时,人们容易寻找一个根因或一个犯错的人,但这种解释遮蔽了真实机制:系统长期在带缺陷的状态下运行,靠冗余和一线人员的持续调整维持安全。事后知道结果,会让旁观者误以为风险当时显而易见,从而低估操作者面对的不确定性。人既要完成生产,又要阻断事故,这两个角色经常冲突。改变也不总是让系统更安全,新技术可能消除常见小问题,同时打开罕见但严重的新失败路径。安全不是某个零件或部门的属性,而是整个系统在变化中不断被人创造出来的结果。没有故障经验的人,也难以识别系统边界在哪里。
你和你的研究一流研究不是单靠运气撞出来的,而是有准备的头脑长期盯住重要问题后的结果。Hamming 反复强调,想做有分量的工作,首先要敢承认自己想做重要的事;社会常把这种野心包装成不谦虚,但没有这种自我要求,就很难把注意力投向真正值得解决的问题。运气会影响具体机会,却不能解释为什么同样处境下只有少数人抓住机会。伟大工作往往需要独立判断、勇气和持续思考,像爱因斯坦少年时追问光速,香农敢用随机编码证明信息论结论。好条件也未必生产好成果,限制常能迫使人换角度,把缺陷变成优势。成名后的危险在于只肯碰大题,忘了小问题会长成大成果。真正可靠的路径,是持续种下小橡子,和能激发自己的人相处,把日常精力集中到少数重要方向上。
你所需要的是链接链接不只是网页里的跳转按钮,而是一种足够简单、足够有表达力的思想原语。标签可以看成指向同一主题页的一组反向链接,文件夹可以看成装满链接的页面,质量信号可以来自被多少地方引用,评论也可以理解为指向某个对象的回应。大纲、主题模型、知识图谱甚至语义三元组,都能用链接重新描述:当前页面是主语,链接文本像谓语,被链接对象是宾语。这样的设计力量在于,它不需要用户额外维护一套复杂结构,知识网络会在写作和引用时自然生长。复杂软件常常把功能堆成沉重规则,而链接展示了相反路径:少数基础机制,只要组合方式开放,就能产生标签、目录、注释、主题和推理结构。思想工具最值得追求的不是功能数量,而是一个小字母表能否支撑足够大的表达空间。
大脑教练揭秘更快学习的秘诀更快学习的关键不是多花时间,而是让注意力、方法和目标对齐。Jim Kwik 童年因脑伤长期受学习障碍困扰,后来把学习本身拆成可训练的能力:先弄清为什么学、何时用、怎样用,目标越清楚,越能跳过无关章节;再识别自己的学习偏好,把视觉、听觉、动作或逻辑优势转化为工具。抽象概念不要硬背,要变成图像、故事和情绪记忆。真正高效的人还会列出不值得做的事,把精力留给最有回报的训练。练习也不是越久越好,低质量重复只会巩固错误;高强度、专注、能获得反馈的练习才会带来进步。睡眠、姿势、呼吸、饮食和环境整理同样属于学习系统的一部分。学习快不是天赋标签,而是一套可调试的生活技术。无论学语言、编程还是商业判断,先设计输入,再设计练习,最后用输出检验理解。
老项目是否应该推倒重写?不一定,老项目最不该因为代码难看就推倒重写。网景在浏览器大战中选择重写,三年后交付缓慢又多漏洞的新版本,市场份额已经被 IE 吃光;技术上后来孕育了 Gecko 和 Firefox,商业上却等同自毁。Basecamp 的相反经验说明,重写能成功的前提不是复制旧系统,而是承认问题、用户和产品判断已经变了。Basecamp 2 删除旧功能、放弃完全兼容,把它当成新产品;同时不强迫老客户迁移,继续维护 Classic。真正的判断标准是:重写是否带来新的产品自由,是否能在有限时间交付,是否尊重既有用户的工作流。否则,重写只会把公司拖进漫长的暂停,既丢掉未来,也消耗现在。代码债只是线索,不是理由;产品债和用户迁移成本才是关键。
图像和文字:2026年的人工智能到2026年,生成式人工智能会在图像、视频和代码辅助上更有用,但距离完全自动生成好莱坞级电影或真正通用智能仍然很远。当前模型的进步很快,扩散模型已经能生成漂亮图片,代码工具也能实际提高开发效率,可它们的弱点集中在结构理解和长期一致性上。视频尤其暴露问题:一只熊的眼睛、船帆或人物位置会在帧间突然变化,因为模型更像是在预测像素序列,而不是稳定地维护物体、空间、动作和时间关系。电影不是一张好图,而是十几万帧都要合理、连贯、服从镜头和叙事。图像模型在构图上也常失败,面对多个物体和明确空间关系时容易漏掉或放错。纹理质量会继续提升,短片和素材生成会变强,动画可能比写实电影更早受益。但从好看到可靠,从单张到长序列,从像素相似到概念理解,是更难的一段路。
关于2023年维基百科重新设计的设计说明维基百科2023年桌面改版的核心难题不是视觉更新,而是在一个由志愿者、语言社区和长期本地改造共同塑造的系统里推进集中变化。桌面阅读界面自2004年以来基本未变,宽屏时代暴露出行长过长、搜索位置不熟悉、目录不便、语言切换隐藏、导航层级混乱等问题。基金会团队希望改善阅读、浏览和未来扩展能力,却不能只按产品团队意志推动,因为每个语言版本都有自己的社区、工具和习惯。设计必须同时照顾99%以上的普通读者和少数高频编辑者:减少侧栏杂乱有利阅读,但也可能切断新编辑发现后台机制的路径。团队选择用更清晰的入口替代分散的链接,把侧栏折叠、行宽限制、标题区域、个人工具和粘性导航逐步原型化。大量HTML、CSS和JavaScript小原型成为沟通工具,因为在发布前让不同社区看见真实交互,比静态稿更能促成有效讨论。
March 202343 threads
人工智能安全:技术与人种学概述人工智能安全争论的麻烦在于,技术问题和部落立场已经纠缠在一起,而争论双方常常连“更强大的系统”都无法清楚定义。要求暂停训练超过GPT-4能力的模型,听起来明确,实际很难执行:GPT-4相对GPT-3的进步并不只是参数变大,而是数据、训练、微调、人类反馈、推理等许多环节的叠加。能力提升没有单一刻度,连开发者也需要开放评估工具,请外部帮助衡量模型到底在哪些任务上变强。于是,人工智能安全变成一种新的身份分界:有人把未来AGI想象成核武器式威胁,有人把当前模型看成有用但经常犯错的工具。没有现实中的AGI作为共同参照,双方都在拿各自脑中的图景做敌友识别。真正困难的政策问题不是喊停,而是怎样定义、测量和监管能力增益,同时避免把研究转移到更不透明、更难约束的地方。
为什么ChatGPT不会很快取代搜索引擎?ChatGPT短期内不会取代搜索引擎,因为搜索的价值不只是回答一句话,而是理解模糊意图、容错、排序、提供选择和保留上下文。聊天模型对提示措辞很敏感,用户换一种问法、拼错词或只知道半个概念时,回答可能完全偏离;成熟搜索系统长期处理的正是同义词、错别字、上下文线索和概念匹配。更关键的是,搜索结果页给用户多个候选、来源、图片、视频、筛选和相关查询,允许人自己判断哪条结果最适合当前目的。聊天界面往往只给一个自信答案,错了也显得像对的,尤其在历史、新闻、产品和复杂研究场景中风险更高。产品搜索更依赖浏览、比较和筛选,天然不适合单轮对话。法律、成本、速度和来源归属也是障碍,但最难消失的是体验问题。一旦聊天系统开始展示多结果、来源、排序和建议,它其实已经重新发明了搜索界面。
对于B2B生成型人工智能应用来说,少就是多吗?对于B2B生成式人工智能应用,少往往比多更有价值。第一波应用擅长发散信息,能生成广告文案、冷邮件、草稿和头脑风暴材料,但在企业场景中,真正被衡量的是决策质量、准确性和工作流效率,而不是产出字数。越是涉及法律、销售、产品发布或专业判断,模型生成的长文本越需要人重新研究、校对和改写,额外步骤可能抵消效率。下一波机会在于综合信息:从会议记录、客户反馈、销售线索、支持工单、财报和新闻中提炼少量关键判断,帮助人更快做决定。理想形态不是用短提示生成长回答,而是把海量资料压缩成可行动的洞察。护城河也会从通用模型能力转向专有数据、特定领域模型和嵌入工作流的能力。胜负不取决于谁的演示更炫,而取决于谁能拥有并改善企业每天必须完成的关键流程。
世界体系的终结冷战后建立的全球化秩序正在结束,核心原因是美国和中国都不再相信经济相互依赖足以压制大国冲突。过去三十年里,西方押注贸易会带来开放,支持中国进入全球供应链中心;中国则用低成本制造、外资和出口高速增长,成为世界工厂。这个体系让美国企业、消费者、金融业和知识工作者获益,却让制造业工人承受代价,也让中国获得了挑战美国的产业基础。2010年代中后期,特朗普关税、投资审查、华为管制和美国制造业焦虑削弱了旧共识;习近平则推动产业自立、加强党对经济的控制,并在外交上更强调斗争。新冠期间的供应链表现和美国内乱强化了北京对自身制度优势的判断。俄乌战争、台湾压力和半导体出口管制把竞争推向零和。市场和富裕阶层的反应显示,增长优先的时代正在让位于安全、权力和阵营对抗。
Noosphere,一种思想协议Noosphere把个人笔记、身份和链接关系设计成一个可退出、可同步、可组合的开放知识图谱。它的目标不是再造一个新的SaaS笔记应用,而是让思想资料不再被锁进平台孤岛。底层依托IPFS保存和分发内容,用户用自己掌握的密钥管理身份和授权,数据结构由备忘录和球体组成:备忘录像带元数据的内容信封,可以指向Markdown、JSON或二进制数据;球体像个人地址簿,记录昵称、公钥和内容指针。这样,链接不依赖某台服务器,而是指向分布式网络中的资源。为了兼顾移动端性能和可靠访问,协议引入球体服务器作为务实的超级节点,负责缓存、固定内容、解析昵称和同步更新。它追求的去中心化并非完全拒绝服务器,而是在云服务的便利和用户拥有数据的退出权之间找到平衡。
ChatGPT是如何建立的?ChatGPT并不是一次凭空出现的技术跃迁,而是OpenAI把已有的GPT-3.5能力重新包装成更容易对话、更符合人类意图的产品。关键做法是在人类反馈强化学习基础上加入对话数据,让模型学会给出有帮助、较真实、较少有害的回答,并在请求不清楚时追问,在越界任务前拒绝。团队原本只把它当作研究预览,用公开使用来收集缺陷,却意外触发大规模传播。发布后最重要的工作变成持续对齐:观察用户如何越狱、制造偏见或虚假回答,再用对抗训练把成功攻击加入训练数据,推动下一轮修正。它的成功说明,模型能力之外,界面、可用性和反馈循环同样会改变技术的社会影响。马虎不得的是,事实性、偏见和拒绝边界仍是核心难题。OpenAI选择先发布再迭代,本质上是在真实世界压力下训练系统。
最低限度的可行生活:如何永远做你喜欢的事?最低限度的可行生活:如何永远做你喜欢的事不能只看表面答案,真正重要的是理解问题背后的机制、边界和现实代价。最小可行寿命(MVL)") 最小可存活时间(MVL) 在技术领域,大多数公司开始时都会开发一个最小可行产品(MVP)。找到你生活中的 "核心功能":所有不能为你的生活带来价值的东西都不是核心,你可以不需要它。设计最精简的版本:一旦你只关注你生活的核心特征,你可能会发现你已经可以为自己工作了 尽早收集反馈,并在必要时进行调整:MVL不是一次性的,而是一个持续的迭代过程。使用 "最小可行寿命 "作为模型给你提供了同样的优势:如果不成功,就迭代并再次尝试。最低限度可行生活计划的第一步是评估你目前的状况。被动收入:任何不做任何工作就能提供收入的来源 储蓄:你长期以来积攒的财富 可变支出:任何你可以摆脱或尽量减少的东西,如果你想的话(例如食物、租金、娱乐)。在表格中,你可以看到你的跑道:在你最初的财务状况下,你可以为自己工作多长时间,直到你耗尽资金。
互联网是模块化的这本书的主要内容是,互联网之所以如此具有生成性,是有具体原因的,而且可以追溯到其历史上早期的架构选择。) 当一个系统是由具有可识别边界的较小的独立部分组成时,它就是模块化。在设计模块化架构时,系统架构师以最小化组件之间的依赖性的方式来分解系统。如果它在使用上是模块化的,产品的用户可以在以后的阶段更换或 "混合和匹配 "组件。网络的模块化边界是为网络化的文件绘制的,内容被分割成 "页面",浏览器引擎被设计用于布局和滚动文本。你可以把像Mighty这样的东西看作是重新划定模块边界的尝试,把浏览器引擎的所有模块放到一个黑盒子里,并把计算能力投向这个黑盒子,直到唯一重要的模块边界是客户端和服务器之间的网络边界。在《技术的本质》中,W.Brian Arthur指出,模块化技术也具有所有这些特性 突变 ← 改变或替换模块 遗传 ← 从旧的模块组成新的模块 技术在不断发展。(W. Brian Arthur, 2009. 技术的本质) 如果你想创建开放式的系统,你需要模块化。
如何使用所罗门悖论来给自己提供好的生活建议?使用所罗门悖论来给自己提供好的生活建议,关键是把目标、限制和可执行步骤放在同一个框架里,而不是只追求单点技巧。尽管所罗门在处理别人的事务时很有智慧,但在处理自己的事务时却严重地近视。2014年,心理学家Igor Grossman和Ethan Kross的一篇论文提出了所罗门悖论的观点。其中之一是,人们 "对另一个人的问题......与自己的问题相比,显示出更明智的推理。"换句话说,有一个广泛的社会认知偏见,这意味着我们在处理其他人的生活和问题时比自己的要好得多。第二,格罗斯曼和克罗斯指出,当我们试图消除自我沉浸--换句话说,当我们试图与自己的问题保持距离--我们在某种程度上更能做出明智的决定。那么,所罗门的悖论告诉我们,如果我们想给自己好的建议,我们应该退一步。如果我们想在改善自己的身份方面采取积极措施,我们需要像对待书中的人物一样对待自己的生活。你个人是否非常理智,但却给出了糟糕的建议,或者你更像所罗门王--当涉及到别人时是个专家,但涉及到自己时却是个笨拙的外行?
ChatGPT的API如此之好,如此之便宜,让大多数文本生成的人工智能都过时ChatGPT的API如此之好,如此之便宜,让大多数文本生成的人工智能都过时的重点在于把看似分散的事实放回具体场景,理解其中的机制、取舍和后果。我怀疑OpenAI会对ChatGPT API收取比GPT-3 API高一倍的费用,因为这是典型的价格歧视,因为每个人都认为ChatGPT要好得多,而且他们不希望掩盖他们现有的GPT-3产品。但考虑到有许多神秘的优化,以使模型如此便宜,我们需要确保ChatGPT API(使用恰如其分的gpt-3.5-turbo模型端点)实际上与我们在使用网页用户界面数月后所习惯的类似,否则这整个事件就毫无意义。这一点,加上一个来回的Python循环,结果是你与一个真实的虚构的人工智能对话......人工智能!( Colab Notebook ) 还不错!而唯一与GLaDOS明确相关的部分是那个巨型 提示的第一句话:你可以调整提示,与你想要的任何角色聊天!
生成式人工智能革命将使任何人都能创造游戏|Andreessen Horowitz随着游戏中生成性人工智能革命的进展,它将完全重塑用户生成内容(UGC),创造一个任何人都可以建立游戏的世界,并扩大游戏市场,超出许多人认为的可能性。现有的UGC平台(即 Roblox)将把生成性人工智能工具添加到他们现有的工具集中,而初创公司将出现,以复制当前的UGC工作流程,但从一开始就为生成性人工智能进行优化。近年来,随着Roblox和Minecraft(分别为5600万DAU和1700万DAU)等UGC平台的崛起,游戏世界发生了结构性变化。所建造的游戏随着工具的力量而扩大,现在可以与专业的开发团队相媲美(见下面Roblox Ultimate Paintball与1月份Roblox Frontlines的游戏画面)。Mods需要对游戏的底层架构和编程有更复杂的理解,但Roblox和Minecraft简化和抽象了游戏创建过程。Roblox于2006年推出,是一个面向低龄儿童的UGC游戏平台,由创始人David Baszucki的洞察力催生,他建立的一些教育物理工具被用来创建游戏。
大型语言模型正在迎来稳定的扩散时刻大型语言模型正在经历类似 Stable Diffusion 的开放拐点:原本只能通过少数公司 API 使用的强大模型,开始能在个人设备上运行和改造。LLaMA 的发布证明,用公开数据训练的较小模型也能接近 GPT-3 级能力;llama.cpp 又通过 C++ 移植和 4 位量化,把 7B、13B 模型压到普通笔记本可承受的范围。模型文件外流让控制权进一步扩散,研究预览迅速变成全球开发者的实验材料。这个变化削弱了平台对使用方式的约束,也带来滥用风险:自动化操纵、虚假内容、难以追责的本地部署都会变得更容易。但同样重要的是,个人和小团队终于能探索本地 AI 的正向用途,包括学习、编程、文档处理和离线工具。真正的竞争将转向完全开放、可商用、可在消费级硬件运行的语言模型,生成式 AI 的创新重心也会从封闭服务扩散到开源生态。
奥威尔的6条规则 - 杜克大学研究生院科学写作资源清晰写作首先依赖克制,而不是华丽表达。奥威尔给出的六条规则强调,写作者应避开已经被滥用的隐喻和套话,因为熟悉的修辞常常让思想显得顺滑,却掩盖了真正要说的东西。能用短词时不用长词,能删除的词就删除,目的都是减少语言中的装饰和噪音,让句子只保留承担意义的部分。主动语态通常比被动语态更直接,也更能说明谁在行动、谁承担责任。外来短语、科学名词和专业术语只有在确实比日常词更准确时才值得使用,否则只会制造距离感。最后一条最重要:规则服务于表达,而不是替代表达。如果严格遵守某条规则会让句子变得僵硬、粗暴或荒谬,就应打破它。好文字的标准不是看起来高级,而是准确、简洁、诚实地把意思交到读者手里。 үsi non-ASCII? I accidentally typed Armenian? Need remove. Wait final already sent? It shows final with partial? The final now invalid maybe due accidental char and ended? We need check. I prematurely final?
斯大林是如何争取东正教会帮助控制乌克兰的斯大林争取东正教会,不是突然放弃无神论,而是把宗教从敌人改造成可管理、可利用的国家工具。1943 年战局转向苏联有利时,他会见仅存的几位东正教主教,允许重建莫斯科牧首区、恢复神学院和部分教会活动,同时通过专门委员会保留国家控制权。这个转向源于现实判断:宗教身份没有被几十年镇压消除,与其让它在地下运行,不如建立官方宗教生活,监督、征税并服务政治目标。乌克兰尤其关键。1939 年苏联吞并波兰东部后,西乌克兰的宗教性和民族政治被视为风险,莫斯科发现东正教也能支持“统一”叙事,把边境人口纳入苏联,并向东欧扩展影响。宗教跨境网络曾被看成威胁,如今变成外交和内政工具。苏联的无神论没有消失,只是学会在需要时批准例外。
保持获取你行业的最新情况保持行业更新的关键不是每天手动追热点,而是把可靠信号固定成一套低摩擦系统。独立创客要同时理解客户变化、竞争对手动作、市场新闻、社区讨论和技术趋势,最有效的来源往往不是单一媒体,而是客户访谈、竞品邮件列表、评论平台、社交动态、论坛、RSS、通讯、播客和少量高质量书籍的组合。做法上,应先限定关注主题和信息源,再用时间盒避免无止境浏览;用 Google Alerts、RSS 阅读器、社交监听、品牌提及监控和精选通讯,把信息推到收件箱。这样更新变成定期处理的输入,而不是随时打断工作的干扰。已经持续筛选信息的人,还可以把这套阅读过程转化为策展通讯,把原本的学习成本变成面向市场的资产。除非信息能帮助定位产品、理解客户或发现机会,否则就应果断舍弃。
CHAT堆栈、GPT-4和软件的近期前景CHAT 栈说明,许多基于 GPT-4 的应用并不需要把专有数据重新训练进模型。更现实的做法是让应用在模型外部维护聊天历史和上下文数据库:用户提出问题后,系统先用相关性搜索从私有资料中找出最有用的片段,再把用户问题、近期对话和这些片段一起放进模型的 token 窗口,由模型基于临时上下文生成回答。这样,SaaS 客服、企业知识库、新员工入职、个人写作档案问答,都能在不昂贵训练模型的前提下拥有“懂业务数据”的聊天界面。关键持久状态有两类:消息历史保存交互脉络,上下文库保存可检索资料;嵌入和向量数据库会帮助在有限 token 中放入最相关的信息。聊天界面的风险也来自同一结构:模型先前的输出会进入后续输入,用户不断引入新变量,使行为难以在上线前穷尽测试。软件近期变化的核心,将是事件流、检索和大模型推理的结合。
技术是如何劫持你的思想的?技术劫持思想,靠的是把人的心理弱点做进界面和反馈机制里。产品并不只是提供选择,它先定义菜单:餐馆列表、新闻流、约会卡片、通知清单都会把原本的问题替换成平台愿意展示的问题,让人误以为眼前选项就是全部可能。应用还把手机变成随身老虎机,刷新邮件、下拉信息流、查看红点通知,都利用间歇性可变奖励,让人反复检查,因为下一次可能有惊喜。害怕错过重要信息也会延长黏性:通讯、社交、约会和资讯服务都让人担心一旦退出就会错过机会。社会认可同样被设计成可操控资源,标签、点赞、关注和推荐会驱动人按平台节奏寻求确认。更好的技术设计应减少这种不确定刺激,帮助用户按自己定义的目标安排信息,而不是把注意力交给默认菜单。掌控界面的人,往往也掌控了选择感。
你应该知道的10个哲学概念理解哲学不必从宏大体系开始,十个基础概念足以打开许多问题。柏拉图的理念论把感官世界与更根本的形式区分开,洞穴寓言提醒人可能把影子当成现实。内省把注意力转向自身经验,追问信念与感受如何形成。唯我论把确定性缩到自我意识之内,迫使人承认外部世界并非可被绝对证明。神义论试图解释全善全能的上帝为何允许邪恶存在。道德相对主义强调善恶判断依赖情境,康德的绝对命令则要求行动原则能够被普遍化,并且不能把人只当工具。决定论质疑自由意志,把事件看成因果链条的一部分。笛卡尔的“我思故我在”把怀疑本身变成存在证明。尼采的“上帝死了”并非简单反宗教,而是指出传统价值根基坍塌后,人必须重新承担价值创造。哲学的作用不是给统一答案,而是训练问题的边界。
2022年的信|王丹云南的山地不仅是风景,也是逃离国家控制的地理结构。2022 年上海封控前离开城市后,长期停留云南让人看见一个与北京、上海不同的中国:北部藏区有雪山、寺院、祈祷旗和隐秘的宗教抵抗,南部西双版纳接近东南亚,茶山、雨林、橡胶和边境贸易交织,大理则以气候、湖泊、农田、咖啡馆、加密社群和新型家庭教育吸引城市流动人口。詹姆斯·斯科特关于高地社会的解释提供了线索:山区历来庇护不愿被征税、征兵、定居和同化的人群,根茎作物、口头传统和平等结构,都让国家更难统计和控制。现代交通和信息技术已经让行政力量爬上山,但崎岖地形仍会削弱命令的效率。大理湖泊治理中,村民失去山泉水后重新上山铺管取水,正是这种规避能力的当代表现。
Misframe - CTEs作为查询表CTE 可以直接充当一次性查找表,用来把数据库里的代码值转换成更适合展示的文本。面对国家代码、状态码、类型码这类字段,常见做法是在查询里写 CASE 表达式,但分支一多就会让主查询变得臃肿;同样的映射如果在多个地方使用,还得反复复制,维护时容易漏改。更清爽的写法是在查询开头用 CTE 构造一张小表,把 code 和 label 一行行列出来,再在主查询中 JOIN 或多次引用它。这样映射规则集中、可读性更好,也更接近真实维表的思路。对于 SQLite 和 PostgreSQL 这类支持 CTE 的数据库,这是一种轻量、无需建表、适合报表和临时分析的技巧。它不替代正式的数据建模,但能让一次性查询少些噪音。
ChatGPT:普通人可了解它是如何工作的指南ChatGPT 的工作方式可以理解为:它接收一组有结构的符号,再输出另一组与之相关的有结构符号。难点不在“把文字变成文字”,而在捕捉复杂、抽象、带概率的关系。简单规则可以处理固定转换,例如把一个词按规则改写;但当“猫”“死亡”“成熟”“不成熟”等词同时出现时,可能涉及生物、情感、文学引用和上下文含义,关系会迅速变得庞大且不确定。大型语言模型用训练数据形成概率空间,提示词像一次观察,把输出压到某个更可能的区域。它不是按人类方式持有真假信念,而是在可能文本集合中选择高概率延续。理解这一点,能减少把聊天机器人拟人化,也能解释为什么同一提示有时可靠、有时偏离。 https://www.jonstokes.com/p/chatgpt-explained-a-guide-for-normies
也许把住房当作投资是一个巨大的错误把住房当作投资,问题在于它要求价格持续超过通胀和工资上涨,而这会让拥有住房的人希望后来者付出更高成本。一个准备买房的家庭如果用长期财务模型比较买和租,就会发现买房是否划算高度依赖房价继续上涨;一旦房价只跟上通胀,购房反而可能损失巨大。住房不像公司股票,价值上涨并不主要来自生产力提升,也不像普通耐用品会因使用磨损而贬值。多数涨幅来自位置稀缺和供应不足,本质上是把财富从无房者、租房者和年轻买家转移给早期房主。房价上涨确实会让许多现有家庭账面变富,尤其在住房是最大财富来源时更明显,但这种繁荣建立在居住成本恶化之上,社会代价被推给后来的人。 https://goodreason.substack.com/p/maybe-treating-housing-as-an-investment
人工智能内容生成第四部分:下一步是什么AI 内容生成的下一步,是从单一工具走向一种新的基础能力,像数据库、网络协议或超文本一样支撑大量新产品。开源模型、商业 API 和定制训练会并行发展,模型数量和变体会迅速增加,成本下降会让小团队也能训练特定用途模型。个性化将成为核心:模型可以学习一个人的照片、文字、语气、宠物和产品素材,生成替代现实的家庭照、商品图、插图或带有个人声音的草稿。写作软件也可能不再只是上传图片,而是根据上下文自动生成配图提示,并在浏览器端实时渲染。更深层的变化来自持续学习:未来模型不只在训练后静态推理,而是在使用中更新理解。难点是避免新信息覆盖旧知识,但一旦解决,软件会更像长期协作伙伴。 https://www.jonstokes.com/p/ai-content-generation-part-4-whats
稳定扩散入门:创作者指南Stable Diffusion 对创作者的关键价值,是把图像生成从封闭服务变成可实验、可控制、可嵌入工作流的工具。它的核心输入是提示词和种子;同一模型版本下,提示词与种子相同,输出也会稳定复现。因此,固定种子再微调提示词,可以在同一片潜在空间里逐步靠近想要的画面;改变种子,则通常会跳到完全不同的视觉方向。提示工程的重点不是写得长,而是写得相关:主题是什么,风格是什么,哪些修饰语能把模型推向正确区域。可以把提示词想成搜索图片时会输入的关键词,但生成工具没有个性化排序和无限滚动,必须更具体。学习路径也很实际:使用 Dream Studio、PlaygroundAI 等工具反复试,借鉴 Krea.ai 等平台上的好提示,在低成本环境里积累直觉。
AI内容生成第二部分:任务和模型AI 内容工具的变化再快,也可以从“任务”和“模型”两层看清方向。研究人员训练模型去完成一组可测量的任务:整体分类、局部分类、比较两件事、提取片段、转换输入、生成新内容、预测缺失部分。前几类更像阅读和理解,后几类更像写作和创造;许多产品只是把这些能力包装成不同界面。模型训练阶段是在数据中建立数学表示,使用阶段则是把输入定位到潜在空间里,询问附近是什么、两点距离多远、它们之间能生成什么。图像领域的基础能力包括分类、物体检测和分割,分别回答图里是什么、东西在哪里、每个像素属于什么。掌握这些任务,比追逐每个新应用更有用,因为新产品大多只是这些能力的新组合。 https://www.jonstokes.com/p/ai-content-generation-part-2-tasks
AI内容生成第一部分:机器学习基础知识理解 AI 内容生成,最好先把“提示”看成搜索查询,而不是命令。模型训练后形成了一个由文本、图像等数字内容构成的潜在空间;输入提示时,用户是在给模型坐标和方向,让它在可能输出中寻找相近结果。生成、分类和转换是三类基础能力:生成制造新内容,分类识别对象或属性,转换把输入改写、翻译、重绘或调整成另一个版本。使用工具时,经验很像搜索引擎:先提出粗略查询,再不断修改提示、筛选结果、设置参数,逐步逼近目标。底层机器学习概念比具体产品稳定得多,掌握这些概念后,新工具再频繁变化,也更容易判断它们能做什么、不能做什么,以及为什么同一个提示会产生不同结果。 https://www.jonstokes.com/p/ai-content-generation-part-1-machine
人类艺术已经与人工智能有了很多共同之处 | WIRED人类艺术与人工智能的共同点,比“机器是否能真正创作”这个争论更重要。创作从来不只是凭空原创,而是在模仿、重复、变形和再组合中形成意义。作家、画家、粉丝剪辑者都会从既有作品中学习节奏、母题和套路,再通过具体语境赋予它们新的重量。网络拼贴、粉丝视频和同人创作说明,重复并不必然贬低艺术;相同桥段被不同人反复使用,反而能成为社群共同语言。真正需要区分的是转化与挪用:借鉴一个模式、致敬一种风格、承认来源地采样,与直接复制他人的迭代并宣称为自己的东西,并不相同。艺术的价值不只在对象本身,也在创作者、社群、记忆和劳动所附加的关系里。若只按交换价值衡量作品,人工智能生成与人类创作看似可替代,人的存在却被抹掉了。
在我20年软件工程师生涯中学到的20件事二十年的软件经验最重要的教训是:建议必须带着场景理解,软件也始终只是达成结果的手段。工程师不可能掌握所有技术,真正困难的部分通常不是写代码,而是弄清楚该不该做、为谁做、做到什么程度。优秀工程师会像设计师一样思考接口和使用者,珍惜少写代码、少维护代码的机会,也会警惕把流程、架构和新工具当成目标。系统最终都会变糟,关键是持续改进到可居住、可交付。数据往往比代码活得更久,老技术能留下来通常因为它可靠。团队管理上,与其寻找神话般的十倍工程师,不如避免制造混乱、逃避反馈、不验证结果的人。写作、追问为什么、保持精简流程,都是工程能力的一部分。 https://www.simplethread.com/20-things-ive-learned-in-my-20-years-as-a-software-engineer/?utm_source=substack&utm_medium=email
如何通过 ChatGPT 赚钱:策略、技巧和策略通过 ChatGPT 赚钱,关键不是把它当作自动提款机,而是把它放进已经能成交的服务链条里:内容、营销、自由职业、教育产品和电商运营。它能帮 YouTuber 生成选题、标题和标签,帮博客与网站生产草稿、元描述和社交媒体文案,也能辅助写电子书、课程脚本、产品描述、简历、招聘信息、翻译稿和品牌命名。更可行的路径是先确定客户或平台需求,再用 ChatGPT 扩大产能、降低起稿成本、生成多个版本,最后由人完成筛选、事实核查和风格调整。收益来自明确场景和交付质量,而不是批量复制低质内容。AI 适合做创意发散、结构搭建和初稿生产,但市场仍会奖励懂受众、懂渠道、能持续改进的人。 https://read.readwise.io/new/read/01gtqtmgkqn3qnd52n1bt8fm28