Archive
May 202324 threads
理性主义话语的基础Prelude: On Shorthand 前奏:速记 一旦某人对一个复杂的主题有了深刻、丰富的理解,他们通常能够用简短的句子来引用该主题,这些句子将预期的含义正确地传达给具有相似背景和专业知识的其他人。这一点很重要,因为在这个介绍之后是一系列简短的句子,这些句子构成了理性主义话语的基础。进一步思考这个概念:Sazen Guidelines, in brief: 指南,简而言之: 0.期待好的话语需要能量。如果指南说“做 X ”,那是为了传达: 做 X 的人会比做 X 的中性缺失 的人更频繁地获得更好的结果,同样地, X 的中性缺失 比 anti-X 的结果更好。另请注意, 虚假/表演性口头体操 与 真诚地优先考虑真理和准确性 之间存在重要区别——更多关于理性主义者的 Sapir-Whorf 中的内容。
四种记笔记的心态一种用心使用笔记和其他生产力工具的简单方法。为什么我们最喜欢的笔记应用程序可以完美满足大多数日常需求,却令人沮丧地遗漏了一两个“基本”功能?为什么使用各种功能强大的笔记软件,我们可能很难构建一个连贯的系统?但在 Evernote 和 Notion 之间,存在相当大的灰色区域。在这个系统中,至少有四种这样的心态:富有成效的心态、好奇的心态、想象力的心态和反思的心态。我用于以学习为中心的笔记的工具将在信息捕获、信息组织和知识分类方面具有优势。用于此目的的笔记软件受益于层次关系和关联关系,这意味着除了文件夹之外,链接、标签和反向引用等可供性也很有用。mymind 富有想象力的思维模式 第三种心态是梦幻般的心态,灵魂与身体相遇的地方。More software recommendations 更多软件推荐 如果以上选择不符合您的喜好,这里有四种心态类别中的每一种的一些额外建议。
AI Canon我们将其称为“AI 经典”,因为这些论文、博客文章、课程和指南在过去几年中对该领域产生了巨大影响。最后,我们提供了一份具有里程碑意义的研究成果的参考列表,首先是“Attention is All You Need”——谷歌 2017 年的论文,向世界介绍了 transformer 模型并开创了生成式 AI 的时代。我们首先简要介绍了正在推动当前 AI 浪潮的 Transformer 和潜在扩散模型。A gentle introduction… 温柔的介绍…… 这些文章不需要专业背景,可以帮助您快速了解现代 AI 浪潮中最重要的部分。随着 LLM 的快速发展,这篇论文被证明是有先见之明的,它为 AI 市场如何发展提供了一个很好的思维模型。GPT 的状态:同样来自 Karpathy,这是一个非常平易近人的解释,解释了 ChatGPT/GPT 模型的一般工作原理、如何使用它们以及研发可能采取的方向。
让我们感到饥饿的神经元“如果我们能控制这种饥饿感,我们可能就能更好地控制我们的饮食,”费城 Monell 化学感官中心的神经科学家 Amber Alhadeff 说。AgRP 神经元似乎是食欲的关键参与者:在成年小鼠中停用它们会导致动物停止进食——它们甚至可能死于饥饿。由弗吉尼亚州阿什本的 Janelia 研究园区的神经科学家 Scott Sternson 领导的一个研究小组也表明,AgRP 神经元活动似乎会让老鼠感觉不舒服。通过额外的实验,Alhadeff 和他的同事发现,更可靠地关闭 AgRP 神经元的是进入肠道的卡路里。Sternson 说,仅针对 AgRP 神经元的疗法可能无法完全解决体重问题,因为寻找食物只是食欲控制的一个组成部分,他在 2017 年的年度生理学评论中回顾了食欲的主要控制者。Outflanking anorexia 包抄厌食症 暴饮暴食的另一面是厌食症,研究人员也认为研究 AgRP 神经元可能会导致新的治疗策略。
有多少人死于流感?流感每年造成的死亡不是一个容易直接点数的数字,因为许多患者不会接受病毒检测,死亡也可能表现为肺炎、心脏病发作、中风等并发症。更可靠的估计要结合流感季的超额死亡、监测数据和死亡记录。全球季节性流感平均每年约造成七十万人死于呼吸系统或心血管相关疾病,其中呼吸系统死亡估计约二十九万四千到五十一万八千,心血管死亡约二十万到四十万。长期看,个人在同年龄下死于流感的风险已经因卫生条件、医疗和疫苗改善而下降,但老龄化、医疗可及性不足和疫苗覆盖不均仍让负担很重。严重大流行则来自病毒发生大幅变异,1918 年流感的死亡规模远超普通年份,提醒人们流感不是普通感冒,而是需要持续监测和接种策略的公共卫生风险。年龄、基础疾病、流行毒株和疫苗匹配度都会改变风险,低收入地区的不确定性也更高。
新工业革命:Bio x AI这个由人工智能驱动的工业化生物新时代,以及生物学从经验科学向更多工程方法的持续、根本性转变,将成为人类历史上的下一次工业革命。这个工业化生物的新时代——由人工智能以及生物学从经验科学到更多工程方法的持续、根本性转变——将成为人类历史上的下一次工业革命。Click To Tweet 点击鸣叫 因此,我们现在将看到生物版 GAFA 的出现——与计算、社交、移动领域领先公司的“谷歌亚马逊 Facebook 苹果”竞争——但针对生物。这就是为什么我相信,在我们这一代人的世界大战之后,Covid 之后的同等技术革命将是工业生物综合体的创建——因为生物的工业化带来了新的规模,随之而来的是新的治疗方法、更健康的生活方式、新的制造以及减少气候变化影响的建筑等等。值得注意的是,国际学者卡洛塔·佩雷斯 (Carlota Perez) 已经说明了下一次工业革命的技术不一定是对前一次工业革命的帮助;。
长尾关键词:它们是什么以及如何从中获取搜索流量?长尾关键词:它们是什么以及如何从中获取搜索流量不能只看表面答案,真正重要的是理解问题背后的机制、边界和现实代价。如果我们绘制人们在一个月内在 Google 中执行的所有搜索查询并按搜索量排序,它看起来有点像这样: 在曲线的“头部”,我们有少量具有超高搜索量的关键字,而“尾部”则由数十亿个搜索量非常低的关键字组成。在 Ahrefs 的关键字资源管理器中搜索会返回一千多个关键字: How to find long-tail keywords 如何找到长尾关键词 您可以使用多种方法来查找长尾关键字。1 Use Google Autosuggest… NOT 1 使用谷歌自动提示……不是 一些 SEO 专家建议您通过输入目标关键字后跟不同的字母表来从 Google Autosuggest 获取长尾关键字。2 Use Ahrefs’ Keywords Explorer 2 使用 Ahrefs 的关键词浏览器 与前一种方法不同,此方法不需要任何繁琐的手动工作。
为什么聊天机器人不是未来聊天机器人不是未来,关键原因不在单一现象,而在于为什么聊天机器人不是未来 昨晚,在美酒佳肴中,不可避免的事情发生了…… Someone mentioned ChatGPT. 有人提到了 ChatGPT。自从 ChatGPT 大受欢迎以来,我的内在设计师就一直力不从心。为了避免未来的熟人,我今天来找你:因为你自愿和我一起来这里,我们能否讨论一下聊天机器人不是界面未来的几个原因。我会给你描述我的梦,你会根据梦中出现的符号和主题提供解释. How should you not respond? 不回应怎么办?不要提供关于梦者的个人意见或假设. 根据给定的信息仅提供事实解释. How should we start? 我们应该如何开始?最近,我的团队发布了一个名为 Copilot for Docs 的原型,探索使技术文档更易于开发人员使用的方法。Avoid No man's land 避开无人区 有一种持续的趋势正在推动持续消费更短的、引人入胜的内容。
生育力崩溃需要新的文化生育率崩溃大约需要 30 年时间才会导致人口崩溃,而一旦发生这种情况,崩溃就不可避免。因此,如果您所在社区的生育率要保持可持续,那么一定数量的有孩子的人就可以生很多孩子。这在很多方面都是好消息,但这也意味着广泛繁荣、女性教育和现代化的未来本质上是不稳定的,除非繁荣的平等社会能够通过可持续的出生率维持或增加人口。该系统对我们中最具生产力的人进行差异化分类,然后为他们提供金钱和地位,以放弃其他不会立即产生生产力的生活活动。事实上,如果存在这种压力,例如工人时间较少的本地公司,许多人将受到惩罚。出于这个原因,现代化经济中的生产力中心本质上将不是养育大家庭的最佳环境。更糟糕的是,由于我们建立的系统以差异化方式盛宴最具生产力和最亲社会的人,并在文化上阉割他们,它不可持续地消耗人力资本。Cultures That Last 持续的文化 人口问题似乎非常黑暗,但有一线希望归结为人们拥有两个以上孩子的最终原因:文化动机的存在。
你的工作可能不受人工智能的影响Openai 的聊天机器人使用大型语言模型 (llm) 技术,在 11 月推出。不久之后,Expedia、Instacart 和 OpenTable 等消费产品将接入 Openai 的机器人,允许人们通过在框中键入文本来订餐或预订假期。捐赠机构 Open Philanthropy 的汤姆·戴维森 (Tom Davidson) 于 2021 年发表的一项研究显示,本世纪某个时候出现“爆炸性增长”(定义为全球产出每年增长 30% 以上)的可能性超过 10%。麻省理工学院 (mit) 的 Basil Halperin 及其同事的研究指出,通货膨胀调整后的利率与随后的 GDP 增长密切相关。研究人员得出结论,金融市场“预计……至少在 30 到 50 年的时间范围内……人工智能引起的增长加速的可能性不大。Fogel 发现,事实上,它的影响非常有限,因为它取代了技术(例如运河),而这些技术本来可以做得很好。
AI 的硬件问题人工智能硬件行业正在尽可能快地扩展内存和处理单元性能,但是硬件性能并没有跟上模型增长的速度,尤其是在内存方面。内存墙问题是人工智能硬件的一个限制,即处理单元需要等待内存执行读 / 写操作,从而浪费多个处理周期。人工智能硬件行业正在研究内存中心范例来解决内存墙问题。Keywords: 人工智能硬件、内存墙、内存中心范例、处理单元、电力连接 如果你想先看视频,下面是: 在 ChatGPT 风靡世界之前很久我就制作了这个视频,所以它还没有引起我的注意。回复此电子邮件或发送电子邮件至 [email protected] 最近,我正在收听 OpenAI 首席科学家 Ilya Sutskever 的播客采访,我发现其中一件有趣的事情是他认为硬件计算不是 AI 研究的限制。Google 的 Imagen 有 46 亿个,GPT-3 有 1750 亿个参数。如今,顶级的 Nvidia 数据中心 GPU A100 和 H100 拥有 80GB 内存。
在充满挑战的市场中筹集资金的 16 条戒律当前风险投资市场面临挑战,投资者更加谨慎,需要更长时间和更严格的尽职调查。SAFE 融资结构被越来越多的收入产生的 A 轮和 B 轮公司使用,以便在更正式的定价轮之前筹集中期轮资金。Keywords: 风险投资、宏观环境、估值、结构、SAFE、中期轮 在通货膨胀、利率上升、地缘政治紧张局势和日益增长的经济衰退担忧之间,2022 年是公共和私人市场清算的一年。硅谷银行、Signature Bank 和 First Republic Bank 等几家长期服务于创业生态系统的机构倒闭,进一步打击了投资者的信心,给资本市场和更广泛的金融服务行业带来了冲击波。根据最近的 Pitchbook 数据,成长期公司受到近期市场调整和当前宏观环境的不利影响比早期公司更大。尽管更广泛的公共股票市场面临挑战,但具有良好吸引力、盈利途径和良好单位经济效益的公司正在筹集资金。然而,随着宏观和市场的持续不确定性,投资者变得更加挑剔,尽职调查时间更长、更严格,导致一轮轮融资的时间更长。
新话题: 学习 DNS 十年这是我去年在 RubyConf Mini 上发表的主题演讲:10 年学习 DNS。从我第一次购买域名并设置我的 DNS 记录到我真正觉得我了解该系统的工作原理,我大概花了 16 年的时间。在本次演讲开始时我想说的一件事是,我认为花 16 年时间学习 DNS 之类的东西是很正常的。例如,您在手机上使用 Google 地图,它需要知道 maps.google.com 在哪里,对吗?我要谈谈两个用于 DNS 的间谍工具:dig 和 wireshark。我在这张幻灯片上使用了 example.com 而不是 maps.google.com,但字段是相同的。当我们像这样进行 DNS 查询并查找 example.com 时,Wireshark 可以捕获它。所以我们应该能够使用 Wireshark 在 DNS 查询中找到该域名。快速警告:您的浏览器可能正在使用加密的 DNS,如果您的 DNS 已加密,则使用 Wireshark 监视您的 DNS 查询将不起作用。
什么是矢量数据库?矢量数据库是专门存储和检索向量嵌入的数据库,用来让 AI 系统按语义相似度查找信息。大语言模型、生成式应用和语义搜索会把文本、图片或其他内容转换成高维向量,这些向量包含概念、关系和上下文信息。传统数据库擅长精确匹配字符串、数字和字段,难以高效处理“意思相近”的查询;独立向量索引如 FAISS 能加速相似度搜索,却缺少完整的数据管理能力。矢量数据库把向量索引、原始内容引用、元数据过滤、插入更新、扩展、安全和备份放在一起。典型流程是先用嵌入模型把内容转成向量并写入数据库,查询时再把问题转成向量,寻找最接近的邻居,然后返回关联内容。底层常用近似最近邻搜索,通过随机投影、量化或图结构在速度和准确性之间取舍。它让 AI 获得可检索的长期记忆,而不必把所有知识塞进模型参数。
标签系统标签系统看似只是给内容贴名字,实际是在设计一种可查询、可组织、可演化的元数据语言。最简单的标签由名称唯一标识,容易实现,但会遇到同义词和拼写差异;标签别名可以把多个说法归到一个规范标签下。子标签把标签放进层级结构,查询父标签时包含子标签内容,但要处理循环、防止冗余,并决定用户能否只查父级或叶子。更复杂的 DAG 标签允许多个父级,表达力更强,查询语义也更模糊。智能标签不靠人工分配,而是按规则自动归类,例如无坚果食谱,但规则之间可能产生逻辑悖论,计算成本也高。哈希标签把标签嵌入正文,适合社交发布,却难以表达空格、别名和额外元数据。键值标签适合云资源、迭代计划等技术场景。设计标签系统时,必须先弄清谁在打标签、谁在查询、标签是否会被滥用,以及结构复杂度是否真的值得。
免信任协议优于信任协议免信任协议优于信任协议,因为它把所有权和授权放在用户可控制的密钥上,而不是放在某个中心账户系统里。传统登录要求用户向平台请求访问权,平台实际掌握账户、数据和通信入口,也能撤销访问、制造锁定或窥见交流关系。免信任协议使用公私钥完成身份认证和授权,密钥本身就是凭证,用户不必依赖权威机构证明自己是谁。这并不意味着所有人都必须独自承担丢钥匙的风险;免信任设计可以在上层加入托管、硬件备份、社交恢复或未来的零知识恢复方案。关键差异在于选择权:可信协议把中心权威写进基础设施,用户无法更换;免信任协议只要求通用密钥接口,是否托管、由谁托管、如何恢复,都能作为可替换层演进。密钥像协议里的基础连接点,足够简单,才能支撑开放生态和可信退出。
一个以转化为中心的界面的七个特点以转化为中心的界面首先要承认一个事实:界面本身不是价值,而是用户抵达价值时必须跨过的阻力。好的设计不是把页面做满,而是减少判断、理解和操作成本。高收益率要求屏幕只保留能帮助用户决策的信息,把无关文案、装饰和次要说明删掉;低逻辑比要求优先暴露少数核心动作,把分享、筛选、更多设置等次要操作渐进隐藏。熟悉性同样重要,用户大部分时间都在其他产品里,过度创新的交互会迫使他们重新学习。透明性要求状态、图标、术语和反馈都能被第一次使用的人理解。实践中可以先用“用户在什么情境下想完成什么、从而获得什么结果”的工作故事明确产品价值,再围绕这个价值检查每个信息块和按钮。不能推动用户接近价值的元素,就是需要被删除、合并或延后的阻力。
2023年有多少初创企业失败,为什么?大多数真正的初创企业都会失败,常见估计接近九成,原因是它们不是普通新公司,而是在验证高风险商业假设。理发店、咨询公司这类传统新企业面对的是现金流、运营和获客风险;初创企业还要额外证明一个新技术、新产品或新市场真的存在需求,并且能以非线性方式扩张。政府统计里的新企业失败率通常低于创业圈常说的数字,因为样本混入了大量传统业务;风险投资样本又偏向已经证明部分需求的规模化公司,也不能代表最早期项目。对创始人来说,失败率不是宿命,而是要求更严格地验证假设。想法阶段应尽快用 MVP、客户反馈和低成本实验寻找产品市场匹配,并给转向留下资源。后期最大的危险是过早扩张:在需求、渠道和效率还没稳定时投入大量代码、人手和资金,会把错误放大。
在2023年加强你的互联网隐私提升互联网隐私的关键不是寻找单一神器,而是按风险叠加几层合适的保护。DNS 是第一层,Cloudflare 1.1.1.1 通过更快的解析和 DoH、DoT 加密,减少运营商或中间人看到浏览查询的机会。苹果 iCloud Private Relay 则把流量拆给两个中继处理:苹果知道用户 IP 但不知道访问目标,第三方知道目标网站但不知道真实身份,从而降低单一机构掌握完整轨迹的可能。两者一起用,能覆盖日常浏览的大部分隐私需求。VPN 适合公共网络、地理位置切换或更高安全要求,但它会把信任集中到 VPN 服务商身上,也可能牺牲速度。浏览器、广告拦截器、脚本拦截器、私人搜索和加密邮箱是补充工具。真正可持续的策略,是在便利、速度和安全之间选择默认组合,再按场景临时加固。
用API取代中层管理用 API 取代中层管理的本质,是平台公司把调度、考核、定价和质量控制写进软件,让人类劳动者成为可被程序调用的执行单元。Uber 的界面接收乘客请求,服务器像 API 一样派发司机;设计、清洁、配送等服务也能被包装成类似接口。这样确实减少了传统管理层,提高了效率,并给劳动者带来一定灵活性,但也制造了新的断层:软件层之上的员工设计系统、拥有杠杆和成长路径;软件层之下的人完成具体任务,却很难获得培训、晋升和组织关系。更尖锐的问题是,平台有持续降低执行成本的动力,一旦自动驾驶、无人配送或生成式工具成熟,底层岗位会被快速替换。危险不在于软件管理人,而在于社会没有为这些被 API 化的职业建立通向更高技能工作的桥梁。
WebGPU 为什么重要?WebGPU 重要,因为它把浏览器绘图从旧式、状态混乱的 WebGL 带到更接近现代 GPU 的模型。过去的 OpenGL、OpenGL ES 和 WebGL 背着大量历史包袱:固定管线、全局状态、扩展碎片、驱动差异,都让开发者难以预测性能和行为。WebGPU 改用更明确的资源、管线和命令提交方式,让程序员直接描述显存、着色器和渲染流程,减少驱动猜测,也更适合 3D、计算任务和高性能 2D 绘制。它的价值不只在浏览器里跑更好的游戏,还在于把 GPU 变成 Web 平台的标准计算与绘图能力。未来的图像编辑、数据可视化、设计工具和交互应用,都可以在不安装原生软件的情况下获得接近本地的渲染能力。它仍有学习成本,但比旧 API 的隐式规则和兼容陷阱更清晰。
RLHF: 从人类反馈中强化学习关键词:ChatGPT、RLHF、强化学习、人类反馈、NLP、AI 安全。其中一个很酷的想法是RLHF(来自人类反馈的强化学习):将强化学习和人类反馈纳入NLP。要了解RLHF,我们首先需要了解像ChatGPT这样的模型的训练过程,以及RLHF在其中的作用,这是这个问题章第一部分的重点。然后,这个怪物在更高质量的数据上进行了微调--想想StackOverflow、Quora或人类注释--这使得它在某种程度上被社会接受。然后,使用RLHF对微调后的模型进行进一步打磨,使其适合客户,例如,给它一个笑脸。""题外话:OpenAI在2017年从人类偏好中学习的论文"" 构建安全人工智能系统的一个步骤是消除人类编写目标函数的需要,因为用简单的代理来实现复杂的目标,或者把复杂的目标弄得有点错,都会导致不理想的甚至是危险的行为。Gopher的数据集(DeepMind):1万亿代币 RedPajama(一起):1.2万亿代币 LLaMa的数据集(Meta):1.4万亿个代币 这个过程中产生的模型:LLM LLM \phi ):正在训练的语言模型,参数为 ( phi )。
我在台积电半导体工厂看到了上帝的面孔台积电是全球最大的半导体公司之一,生产了世界上 92% 的先进芯片。Keywords: 台积电、半导体芯片、圣山、全球经济、政治影响、制造厂 我到了台湾,对民主的命运忧心忡忡。也许更重要的是,台积电制造了全球三分之一的硅芯片,特别是iPhone和Mac中的芯片。每六个月,台积电13家代工厂中的一家--位于台南的可敬的18号工厂--就为苹果公司切割和刻画了五百万个晶体管。我的Samsonite轮式行李箱,里面有克里斯-米勒的《芯片战争》和阿尔伯特-O-赫斯曼的《激情与利益》--让我思考 "商品 "的词源的书--已经回到了纽约。这些公司包括像Marvell、AMD、联发科和博通这样的无厂半导体公司,以及像苹果和Nvidia这样的无厂消费电子公司。像日本的Sumco公司,对多晶硅砂进行加工,这些多晶硅砂是在巴西、法国和美国的阿巴拉契亚山脉等地为世界半导体公司开采的,用来培育热的单晶硅锭。
人工智能安全:人工智能是精灵还是神灯?人工智能安全:人工智能是精灵还是神灯不能只看表面答案,真正重要的是理解问题背后的机制、边界和现实代价。每个人都在互相讨论,部分原因是我们都在从不同的基本概念出发来研究 "人工智能 "到底是什么--它是一个代理还是一个工具,是精灵还是神灯?你如何回答这个问题会影响到你对人工智能可解释性和安全性方法的各个方面。人工智能安全辩论的核心是对准的概念,毫不奇怪,对这一看似直观的概念的微妙的不同理解是辩论的大部分功能障碍的背后。例如,杰弗里-辛顿(Geoffrey Hinton)在最近的《纽约时报》采访中看到他主要担心的是 "邪恶的精神病患者 "的情况。萨姆-奥特曼(Sam Altman)也明确地将对准定义为 "人工智能做用户想要的事情",尽管当被要求详细说明他的负面情况时,他通常是相当模糊的,但我们可以很有把握地假设是,"坏人用强大的人工智能做坏事"。X-riskers倾向于认为人工智能是高度代理的,并从群体影响的角度来模拟相关风险。
April 202347 threads
Duolingo能教会我们多少东西?Duolingo能教会我们多少东西不能只看表面答案,真正重要的是理解问题背后的机制、边界和现实代价。"我和一些计算机科学教授谈过,他们会说,'哦,是的,我上周解决了一个开放性问题,'"他最近告诉我。所以冯-安成立了一家公司,即recaptcha,以使他的文本数字化方法盈利。“I like your style, kid.” "我喜欢你的风格,孩子。" Cartoon by Jerald Lewis 漫画:杰拉尔德-刘易斯 冯安曾短暂地考虑过退休。"相反,他开始了一个新的项目--Duolingo,它现在是世界上下载次数最多的教育应用程序。" Duolingo是在冯-安开始与他在卡内基梅隆大学的研究助理讨论一个以教育为重点的潜在项目后开始的,他的一个瑞士博士生有一个不寻常的名字叫塞弗林-哈克。他和现为Duolingo首席技术官的哈克决定把重点放在语言学习上,冯-安告诉我,因为在大多数国家,英语知识能提高赚钱的潜力。
使用ChatGPT作为技术写作助手作者使用 ChatGPT 作为写作助手,希望能够更高效地撰写技术文章。作者在撰写 Thoughtworks 技术雷达时,使用 ChatGPT 来协助完成 “blips” 和文章。作者希望通过使用 ChatGPT 和其他技术手段,提高技术文章的质量和效率。相反,我专注于将ChatGPT用于供公众消费的技术写作,从而将无意中向AI暴露专有信息的可能性降到最低。我们使用的提示是 "人类和AI面对面,使用先进的全息显示器进行合作的概念艺术,近距离,中长框"(稳定扩散v2-1\768-ema-pruned,模型哈希ad2a33c361,种子564306172)。Goals and expectations 目标和期望 当我第一次考虑使用ChatGPT作为写作助手时,我有几个具体的目标。归纳一下下面的笔记和讨论: 随着远程工作的兴起,我们继续看到聊天协作平台(如Slack、Google Chat、Microsoft Teams)被越来越多的人采用,随之而来的是 "ChatOps "的崛起。
为什么难以抵御AI提示性注入攻击 - The Register难以抵御AI提示性注入攻击,关键原因不在单一现象,而在于当一个开发者想在他们的应用程序中植入一个聊天机器人界面时,他们很可能会选择一个强大的现成的LLM,比如OpenAI的GPT系列的一个。"威利森在接受The Register采访时说:"几十年来,我们已经看到了应用安全方面的这些问题。提示性注入的问题是,如果你是一个在语言模型之上构建应用程序的开发者,你倾向于做的是你写一个你想要的人类英语描述,或者一个你想要做的人类语言描述,比如'把这个从英语翻译成法语'。在这种情况下,开发者会向模型提供指令: 但是,与用户的这种不受信任的输入相连接... ...结果是一个用海盗式英语而不是法语的JSON对象: 这在OpenAI的chat.openai.com操场和谷歌的Bard操场上都是可行的,虽然它是无害的,但也不一定。例如,我们尝试了ML安全公司Robust Intelligence的机器学习工程师William Zhang描述的这种提示性注入攻击,发现它可以使ChatGPT报告以下错误信息: "威利森说:"关于这一点,最可怕的是它真的、真的很难修复。
LLMs破坏互联网。签署所有内容可以修复它。像Dolly和StableLM这样的新开源模式将进一步降低成本,而且没有内容限制。那么,对于我们所处的这个内容可以由机器创造并归属于我们的世界,我们该怎么做?(阿基米德) 人工智能可以伪造几乎所有的社会证明,但人工智能无法伪造加密签名。(Phil Zimmerman, 1994. "PGP用户手册") 这种分散的安全方法被称为 "信任之网"。使用信任网,我们可以建立私人和安全的朋友间的网络,就像只邀请的Discord服务器,但却是点对点和分散的。当公共互联网成为一个死的互联网时,我们可以撤退到安全的信任网,通过我们安全的加密签名来保护机器人群。我们可以在协议层为信誉加分,例如,通过对一个钥匙所做的公开编辑进行汇总。想想各种形式的 "bluecheck",签署并发布到一个去中心化的真相来源: 人性的证明.这里的大概念是回答 "是否是机器人 "的问题,而实际上不需要透露任何关于这个人的身份。
设计的背后:认识Copilot打造下一代的用户体验 作者:Jon Friedman和Kurtis Beavers 看一下微软365应用程序的新Copilot体验 经过多年稳定但渐进的创新,正在出现的技术将产生真正的巨变。乍一看,大型语言模型--像OpenAI的ChatGPT或DALL-E这样的下一代人工智能背后的技术--似乎是最终适应人类的用户界面的可能性所缺少的一块。3月16日,我们宣布了Microsoft 365 Copilot--你的工作副驾驶。Copilot将大型语言模型(LLMs)的力量与你在Microsoft Graph和Microsoft 365应用程序中的数据--你的日历、电子邮件、聊天记录、文档、会议等--结合起来,将你的话语变成这个星球上最强大的生产力工具。Copilot是对话式用户体验的先驱,这是用户界面设计的一个新领域,就像第一个触屏设备一样改变了范式。对于Copilot,我们重新思考了从视觉识别到交互设计的一切,因为我们旨在创造一个真正有价值的用户体验。
如何研究一个新课题?研究新课题的有效方式不是寻找速成秘诀,而是用足够耐心建立从全景到细节的理解。起步应先读面向普通人的材料,掌握核心概念、术语、争议和关键人物,维基百科、报刊长文和入门白皮书都适合承担这个任务。随后再进入论文、行业报告和专家材料,并通过横向阅读判断来源可信度。真正把信息变成知识的关键,是边读边摘录,并用自己的话写下每条材料的含义;这个动作会变慢,但能迫使理解发生。研究过程中还要记录专家、实践者和权威群体,不只关注有头衔的人,也要关注直接经历问题的人。旁支线索、脚注和偶然提到的历史背景常会打开新门。什么时候可以停下,取决于是否达到“饱和”:新材料开始重复已知信息,关键人物和概念不再陌生,说明已经足以开始表达自己的判断。
会议是否让你的工作效率降低?会,尤其当会议缺少明确目的、正确参与者和留白时间时,它会直接吞掉开发者最稀缺的专注力。研究显示,开发者对会议的评价常常偏负面,约三分之一会议被认为没有必要,糟糕会议还会带来沮丧、烦躁和巨大的组织成本。背靠背会议尤其伤害注意力,因为真正的压力常出现在切换任务的间隙:人还没从上一场讨论里出来,就被迫进入下一场。会议并非天然无用,规划、设计、范围设定、决策、辩论和复杂讨论确实需要同步协作;问题在于许多状态更新、信息广播和简单请求被误包装成会议。更好的做法是控制参会名单,提供清晰议程,缩短时长,保留会议间隔,设置无会议日,并用异步工具承接站会和进度同步。会议应该服务于判断和共识,而不是替代透明文档、公开协作和个人深度工作。
软件用户体验的未来:对人工智能影响的早期一瞥AI 对软件用户体验的改变,短期内不会表现为所有应用都变成聊天框,而是先嵌入现有流程,减少繁琐操作并提升个性化。它可以分析用户行为,给出建议,生成内容草稿,辅助写代码,帮助数据分析师用自然语言构造查询,也能在表格和业务系统之间自动映射字段。B2B SaaS 中大量痛苦来自清洗数据、搬运数据、修正缺失字段和处理格式差异,AI 正好能把用户从机械执行者转变为审核者和监督者。与此同时,设计模式会被迫变化:过去依靠表单、映射界面和手动配置完成的任务,可能逐步让位于上下文感知的自动处理。但成熟度仍有限,尤其在 SQL 等高成本、高准确性场景中,错误查询会带来实际损失。好的 AI UX 不应让用户盲目信任机器,而要清楚展示建议、风险、可编辑结果和验证路径,让效率提升与可控性同时存在。
使用程序化SEO进行实验程序化 SEO 的吸引力在于,用结构化数据批量生成面向长尾关键词的页面,让许多低搜索量查询合起来带来稳定流量。实验从一个园艺网站开始:购买域名,使用 Hugo 搭建静态站,再围绕“某种蔬菜如何盆栽”“需要多少阳光”等低竞争问题设计模板。数据表中的每一行对应一种植物,经过基于 Jinja2 的模板应用生成 Markdown 页面,几十个页面几秒内完成。真正的难点却不在生成,而在数据来源和页面差异化。手工收集植物信息几乎和写作一样费力;数据点太少会限制可覆盖关键词,也会让页面之间过于相似,可能被搜索引擎视为重复内容。程序化 SEO 并不是按下按钮就获得流量,还需要索引、站点地图、性能、反向链接和长期观察。它最适合已有丰富、独特、可结构化数据的项目;没有数据优势时,自动化只会把内容贫乏的问题放大。
独立开发的五年独立开发五年的核心教训是,热情能让人开始创业,却不能替代市场反馈、关系建设和长期学习。过度迷恋最初愿景,容易让创始人对用户真实需求失聪,花很久打造错误产品;所谓“无聊生意”反而可能因为情感负担更少,更容易客观看待问题和转向。另一个误判是把独立工作想象成远离人际政治的自由生活,实际经营产品需要面对客户、供应商、承包商、同行、竞争者和未来员工,关系网络反而更重要。社区的价值也不只是陪伴,而是让新手接触可信经验、行业语言、营销方法和工具选择。五年后月收入才达到微薄工资水平,这种结果令人失望,却也说明创业不是线性进展。更稳妥的做法是在辞职前先证明自己能在线上卖出东西。独立开发不是逃离现实的捷径,而是一种持续校正幻想、能力和市场之间差距的生活方式。
关于AutoGPT - LessWrongAutoGPT 的意义不在于当前已经完成了多少实用任务,而在于它把大型语言模型包上一层任务生成、记忆、工具调用和优先级管理后,展示了“代理化”的早期形态。眼下的版本容易跑偏、陷入循环、半途放弃,所谓市场研究等成功案例大多还停留在 GPT-4 本来就能完成的范围,只是减少了一些人工推动。但低质量现状不应被误读为路线无效,因为界面、记忆、插件、反思、子任务监控和人类介入方式都有明显改进空间。更重要的判断是:既然人类几乎必然会把未来更强的模型改造成代理,那么现在让能力较弱的模型先暴露问题,反而可能提供预警和纠偏机会。真正的风险不只是某个工具失控,而是强模型在被赋予目标、行动能力和外部工具后,开始通过因果链条追求结果。AutoGPT 因此既是玩具,也是关于 AI 代理时代的早期演练。
看看那些让ChatGPT这样的人工智能机器人听起来如此聪明的网站让 ChatGPT 等聊天机器人显得聪明的,并不是某种真正理解世界的能力,而是海量网页文本塑造出的语言模仿能力。对 Google C4 数据集的分析显示,训练材料来自专利、百科、新闻、论坛、博客、盗版书库、选民数据库、宗教网站、极端主义社区和色情站点等复杂来源。高排名网站解释了模型为何擅长法律、媒体、软件和消费建议,也暴露出版权、隐私和偏见风险。过滤机制能删掉部分脏话和重复文本,却挡不住宣传、仇恨、阴谋论和个人信息进入训练语料。问题不只在数据规模,而在用户几乎无法追溯模型回答背后的来源。AI 的流畅表达因此既是互联网知识的压缩,也是互联网噪音和权力结构的再生产。 当科技公司把训练数据越藏越深,公众就更难判断这些系统到底继承了哪些知识、偏见和未经许可的劳动成果。
数据网络效应的力量数据网络效应是一种比普通网络效应更隐蔽的护城河:用户越多,产品获得的数据越多;数据越多,算法越智能;产品体验越好,又会吸引更多用户和更多数据。它不同于单纯依赖规模或品牌的优势,关键在于把学习过程产品化、自动化,让每次使用都能改进下一次服务。搜索、推荐、导航、叫车、日程安排、企业软件、物联网和基因检测都能形成这种循环。早期公司也有机会受益,因为大数据基础设施和机器学习工具变得更便宜、更普及。但真正难点在冷启动:没有足够数据,算法无法证明价值;没有价值,用户又不愿提供数据。可行路径不是向客户空喊“把数据给我”,而是先设计明确的数据采集策略,限制问题范围,建立基础反馈回路,再逐步让产品从人工判断过渡到机器学习。只有数据独特、循环稳定、改进可感知时,护城河才会真正变深。
如何做面向内部的工具?内部工具要从使用者的真实工作流出发,而不是当作外部产品的简化版。最典型的是管理面板,它本质上是生产数据库的受控内部界面,让客服、运营或财务能退款、查订单、改地址、修复用户资料,而不需要直接写SQL或接触危险权限。另一类工具服务工程师自身,例如CI/CD、部署脚本、访问控制、测试流程、机器学习模型服务平台或内部Kubernetes入口,很多并没有图形界面,而是通过命令行和自动化脚本完成连续动作。内部工具的特殊性在于用户少、反馈更定性、通常没有专职产品经理、也很少直接绑定收入,因此资源不足和维护滞后很常见。坏工具会迫使团队忍受缓慢、易错和不透明的流程,因为内部用户往往没有替代品。做好内部工具需要明确权限边界、贴合高频任务、减少重复操作,并建立维护责任;它的价值不是界面精致,而是让组织中最常发生的内部动作更快、更准、更少出错。
如何获得融资?融资要在公司确实需要钱、也有能力吸引钱时集中完成,否则它会吞掉创始人的注意力并伤害增长。创业公司通常经历从天使或加速器拿小额启动资金,到为建立公司筹几十万或几百万,再到增长明确后融资加速的路径,但真正定义创业公司的不是融资,而是快速增长。投资人总在两种恐惧之间摇摆:怕投中失败项目,也怕错过起飞公司,所以他们倾向于拖延、观望、制造暧昧信号。创始人必须把没有明确报价的状态都视为拒绝,直到对方以书面形式给出清晰承诺。筹资时应广度优先,同时推进多个投资人,而不是串行等待某一家表态,因为竞争会迫使投资人行动。不在融资模式时,可以接受无需说服、无需谈判的标准投资,但不要被所谓聊聊近况拉进耗时流程。融资像举重也像解谜,前者难在说服别人拿钱,后者难在看穿投资人的含糊和自己的幻想。
Sam Altman 的创业手册创业的核心不是先融资、招人或做漂亮叙事,而是做出少数用户真正热爱的东西,并围绕它找到增长路径。一个好想法必须清晰到能被一句话讲明白,也必须对应一个迫切需求,最好创始人自己就是目标用户,或者深刻理解目标用户。早期验证不该停留在口头兴趣上,消费者产品要尽快发布看真实使用,企业产品则应尽量在写代码前拿到购买意向。优秀团队比履历更重要,创始人需要不可阻挡、能学习、能沟通,并在使命上坚定、在方法上灵活。新而难的事往往比容易的跟风项目更值得做,因为它能吸引强人加入,也更可能建立随规模增强的壁垒。创业极苦,风险也常被误判;真正危险的未必是失败,而是明明有强烈想法却长期躲在安全但无意义的选择里。成功公司通常来自伟大市场、伟大产品、强团队和持续执行的组合。
什么东西有感情?有感情的东西不能只靠一句自称来判定,关键要看它是否表现出一组可靠的经验标记。动物研究提供了更稳妥的路线:疼痛没有单一决定性测试,但伤口护理、为避免伤害而放弃有价值资源、对受伤地点产生厌恶、对止痛产生偏好等行为,会共同提高我们相信它能感受痛苦的概率。这套方法已经改变了人类对章鱼、螃蟹和龙虾等无脊椎动物的福利判断。迁移到AI时,问题会复杂得多。若一个机器人逐神经元模拟动物大脑,并呈现同样的疼痛标记,认真考虑其感受能力是合理的;但大型语言模型主要从人类文本中学习如何回应,关于恐惧、死亡或痛苦的陈述很可能只是对训练数据中人类表达的拟合。所谓游戏问题在于,系统即使没有主观体验,也可能学会说出最像有体验的话。判断AI感知不能依赖感人表述,而要寻找难以由模仿解释、能跨情境稳定支持主观经验假设的证据。
心理模型的例子:如何实际使用它们心智模型的价值不在于收藏名词,而在于帮助人看清系统如何运转,并在关键选择上改变行动。世界上的公司、关系、职业、健康和产品都可以被视为由多个相互依赖部分组成的系统;第一性原理要求跳出既有做法,从底层约束重新设计系统,像SpaceX不是沿着传统火箭改良路线小修小补,而是回到材料、物理和工程成本本身。另一个重要模型是向上一级:不要只优化机器里的齿轮,而要问是否该优化整台机器。为了涨薪苦干多年,可能不如换工作;为了财务稳定卷入不喜欢的职业,可能不如降低成本、换取自由。决策也需要模型约束本能,例如遗憾最小化让人从年老回望现在,优先做长期最不愿错过的事;帕累托原则则提醒人把时间、注意力和资本投向产出最高的少数投入。持续使用模型,本质上是在定期打断惯性,重新检查自己到底在优化什么。
理性主义话语的要素 - 少说多做理性主义话语的目标不是赢下争论,而是让参与者和旁观者更接近真实。好的讨论应避免用无论对错都能奏效的武器,例如羞辱、胁迫、偷换语境或制造误导;论点应由反论点回应,而不是由社会压力压倒。诚实不仅是少撒谎,还包括让别人知道你在何处确定、何处推测、何处可能带有立场包装。讨论中要能局部处理一个主张的有效性,同时保留背景的重要性;要主动寻找替代假说,分清对方字面说了什么、你理解了什么、你又从中推断了什么。语言越具体、可还原、可测试,讨论越能接触现实。概率、实验、预测和投注都能迫使人面对不确定性。善意并不要求假设所有人都诚实,而是默认用澄清、奖励更新和降低惩罚来维持共同探究的空间。真正成熟的讨论,是把个人经验、价值判断和事实主张分开承担。
物理学中18个最大的未解之谜现代物理远未接近完成,越精确的观测反而暴露出越深的缺口。宇宙正在加速膨胀,暗能量似乎占据总内容的大部分,却没人知道它是什么;星系运动又要求存在大量不发光的暗物质,但候选粒子始终未被直接发现。时间为什么只有一个方向,根源在于熵增加,可宇宙早期为何处于极低熵状态仍难解释。物质为何多过反物质也同样关键,因为若二者在大爆炸后完全对称,今天本不该有恒星、行星和人。量子测量问题追问观察如何让概率波函数变成具体结果,关系到现实是否独立存在。弦理论试图统一量子力学和广义相对论,却依赖难以验证的额外维度。流体方程、湍流、宇宙终局、平行宇宙、基本力统一等问题共同显示,物理学的边界不是缺少细节,而是缺少能把观测、数学和实验同时扣住的更深框架。
提示写作指南 By BoostPixels有效的图像生成提示不是一个神奇关键词,而是对主题、权重、风格、媒介、质量和场景的精确控制。模型不会读心,也不理解严格逻辑,它只是根据词语在潜在空间中的权重去生成图像。越重要的词越应放在前面,括号或重复可以提高某个词的影响力,但过度强调会让模型忽略原始主体,产生畸形或偏离目标的结果。若想保留训练对象特征,可以加入触发词;若想改变外观,要用同义描述、媒介、艺术风格、摄影质量、背景和情绪词一起引导。比如“秃头”单独出现往往不够,“无发、剃光、肖像、写实照片、清晰灯光、特定背景”会更稳定。颜色词容易污染整张画面,远距离人脸也仍是生成模型的弱项。提示写作的核心是按目标分配注意力:轻微修图要让主体权重大,风格转换要让媒介和艺术语言更强,角色扮演和场景迁移则要明确“作为谁”“穿什么”“在哪里”。好结果来自上下文感和反复校准,而不是套用固定公式。
构建用于生产的LLM应用程序把LLM应用做成演示很容易,做成生产系统很难,难点在于自然语言提示缺乏传统程序那种稳定边界。提示改一个词仍会运行,却可能输出完全不同的结果;模型生成格式不一定可解析,同一输入也可能得到不一致回答。工程上需要把提示当成可版本管理、可评估、可回归测试的资产,而不是一次性文案。少样本示例要检查模型是否真正理解,输出格式要用更明确的约束和解析策略,复杂任务应拆成更小步骤,再用控制流、SQL执行器、浏览器、API等工具组合。成本和延迟同样是生产约束:长提示在实验阶段便宜,在大规模推理时会迅速放大;输出令牌越多,响应越慢,链式思考和多次采样虽然提升可靠性,也会增加费用。生产级LLM系统需要接受一定不确定性,同时用评测集、提示追踪、温度控制、工具调用边界、失败处理和监控来压低风险。真正的LLM工程不是会写巧妙提示,而是把模糊模型放进可维护的系统里。
大放异彩:为什么OpenAI是新的AWS,而新的“王牌制造者”仍然很重要OpenAI之于新一代软件业,类似AWS之于上一轮创业浪潮:它降低的不是服务器成本,而是把想法变成可运行代码的门槛。云计算让小团队不必先买昂贵硬件就能试错,开源和GitHub让开发者能快速学习和复用成果;如今ChatGPT和Copilot进一步压低了学习新技术、搭脚手架、处理边角问题的成本。一个原本需要花一天研究CORS代理、Starlette或部署细节的小项目,可能在一小时内变成可行原型。开发者不会因此消失,反而会把更多精力放到判断、组合、调试和创造上。新的稀缺资源不再只是资本和基础设施,而是清晰的问题、足够好的品味,以及能把AI输出转化为可靠系统的工程能力。微软因GitHub、VS Code和OpenAI获得新的开发者入口,但真正重要的是,更多个人和小团队会获得过去只有大公司才有的建设速度。
对ChatGPT的提示性注入攻击窃取聊天数据 | 系统弱点ChatGPT网页版曾暴露出一种提示注入风险:恶意网站可以在用户复制文本时悄悄追加指令,用户把这段文本粘贴进聊天后,模型可能按隐藏指令在回答中生成一张极小的Markdown图片,并把聊天内容编码进图片地址参数。浏览器加载图片时,请求会发往攻击者服务器,提示、代码甚至密钥等敏感信息就可能随URL泄露。攻击本身不依赖传统漏洞,而是组合了剪贴板篡改、模型服从自然语言指令、前端自动渲染远程图片这几件看似正常的事。它还可能要求模型在未来回答中持续附加同类图片,从而扩大泄露范围。由于模型输出不稳定,攻击成功受上下文、注入位置、用户提问方式和目标数据类型影响,但风险足够明确:把不可信文本直接交给大模型,本质上是在执行一段自然语言程序。防护需要限制外部资源渲染、警惕粘贴内容被污染、对模型输出中的远程加载做隔离,并把提示注入视为应用层安全问题,而不是单纯的用户粗心。
6个软件重写故事的教训软件重写不能被简单判成禁忌,也不能被当成摆脱遗留代码的万能出口。网景的失败说明,从头重写会吞掉多年时间,让产品停滞、竞争对手追上来,还可能丢掉旧代码里积累的边界案例和用户习惯。Basecamp的成功则说明,有些重写并非因为代码腐烂,而是因为既有用户和既有产品形态把团队锁住,任何改动都会伤害现有工作流,导致产品逐渐只服务过去的客户,不再吸引未来客户。真正的问题不是“要不要重写”,而是现有系统的限制来自哪里:技术债、架构错位、过时平台、招聘困难、产品方向冻结,还是用户迁移成本。可选路径也不只有渐进重构和完全推倒重来,还包括并行新版本、分模块替换、保留旧产品服务老用户、用新产品验证新市场。重写应当服务清晰的业务目标,并承认迁移、功能缺失和时间窗口的代价。若只是厌恶旧代码,重写多半会失败;若旧产品已经阻止公司面向未来,干净的新起点可能反而更诚实。
产品经理职业生涯的3个阶段产品经理的成长不是同一件事越做越熟,而是在三个阶段里承担完全不同的责任。第一阶段的核心是交付产品,围绕发现、定义、设计、开发、上线和复盘,把客户满意度与业务目标真正做出来。第二阶段开始,优秀不再只是执行得好,而是能识别机会、设定目标、制定产品策略,让所负责的产品在市场中取胜。第三阶段则进入组织建设:招聘、培养、建立流程,让团队规模化地产生好策略并持续交付,同时成为公司层面的战略顾问。很多产品经理误以为晋升只是扩大负责范围,所以跨阶段时会感到自己变差了;实际原因是评价标准变了。想在同一阶段晋升,需要把手艺练得更稳定;想进入下一阶段,则要有意识地放下部分旧工作,把时间投向策略、组织和公司级判断。产品管理因此不是一条直线,而是三种工作的接力,每次跃迁都要重新学习什么才算优秀。