2026年6月17日super-user

超级用户日报: 2026年6月18日

今天最跳出来的模式，是键盘正在离开关键路径。一个Anthropic工程师把话说白了：如果你在盯着Claude写代码，你就是QA测试员，而这不是你的活。大家在用/loop过夜跑、用Routines脱离、在手机上驱动会话——而这几乎一切背后的硬约束是token成本：一个简单任务烧掉130万token、一个周末几百美元的账单，正把人逼向本地硬件。另一条主线是非编码工作：一条prompt产出一篇发表的论文、一个被裁的工程师把求职本身做成了agent流水线、一个老婆每天跟定制的陪伴agent聊天、一个投资人花12小时做的Meta分析。而在钱之下，认真的人反复念叨同一句——模型是租来的，harness才是护城河。

@hanakoxbt [Claude Code]

Claude Code#1

https://x.com/hanakoxbt/status/2066969072818872627

一个Anthropic的Claude Code工程师一句话把整个转变讲透了：如果你在盯着Claude写代码，那你就是QA测试员，而这不是你该拿钱干的事。37分钟里他讲的是怎么把键盘彻底踢出关键路径。/loop让Claude每10分钟醒一次替你盯PR，你人都不在电脑边；Routines在云上做同样的事、机器还能关着；远程控制让你在手机上驱动任意会话。键盘不再是瓶颈。

@yibie [Claude Code]

https://x.com/yibie/status/2067013525298663433

一家跟他合作的创业公司把整本工程手册扔了，开了个作战室会议从零重建，第一条规则是：上午10点前不写代码。过去二十年工程文化都在追求最大化敲键盘的时间，这个团队反着来，每天上午一起pair prompt、定义目标、把agent设置到能成功为止。更深的翻转是那句宣言：现在干活的是agent，不是工程师——工程师的活是确保agent能把活干好。为agent这个首要用户设计，定义结果而不是过程，复核产出而不是代码。

@dotey [Claude Code]

Claude Code#3

https://x.com/dotey/status/2066777376399245356

一句很直接的token经济学抱怨，同时也是个警告：Claude Code的动态工作流在一个简单任务上一下生出31个agent、烧掉130万token，把他Pro 20x套餐的周用量从11%顶到20%。他的判断是这根本不划算——宁可慢点。这是对"放出一群agent"那种炒作的有用反例：agent越多不是免费的，账单是真的。

@nasqret [Claude Code]

Claude Code#4

https://x.com/nasqret/status/2066826720473223334

一个数学家全力押注"loop哲学"两周，拿出的前沿结果是实打实的，不是感觉。一个跑在Groebner基论文上的Codex循环重构了证明结构、把所有吃CPU的重计算都去掉，只留下人能手验的步骤。一个堆球循环用Python核对了Fisher的表格、还翻出了原工作漏掉的一个堆叠例子。还有一个Claude Code循环做了个GitHub演示，教高中老师agentic工作流。这是autoresearch在悄悄做真数学。

@MushtaqBilalPhD [Claude Code]

Claude Code#5

https://x.com/MushtaqBilalPhD/status/2066832015908118730

一个研究者让Claude Code从一条prompt里产出了一篇完整的研究论文——还带原创论点——他说Pangram判定100%人类写的，而且论文真的发表了。先把"骗检测器"那套争论放一边；值得注意的是，一个有真实学术分量的非编码知识产出，从一个编程agent里一次性出来了。他还给了一份可复现的分步教程。

@wecraveai [Claude Code]

Claude Code#6

https://x.com/wecraveai/status/2066807136672534876

一个人被裁了，在Claude Code上搭了套AI求职系统、用它评估了740多个岗位、拿下了一个Head of Applied AI的offer，然后把整套东西开源成career-ops。一条斜杠命令就把一个职位链接变成一份A到F的结构化评估、一份针对这个岗位的ATS优化PDF（用Playwright渲染）、薪资调研、面试准备、外加一条追踪记录。14种skill模式、一个能扫45家以上公司门户的扫描器、用Claude子agent做批量评估。这是把求职本身变成了一条agent流水线。

@amandaorson [OpenClaw]

OpenClaw#7

https://x.com/amandaorson/status/2066927382783504598

从OpenClaw换到了Nous Research的Hermes，用法纯是运营，不是编码。一份日报（配上Last 30 Days这个skill）每天早上把房地产投资者的痛点从X、Reddit、YouTube上捞出来。一个项目管理agent读Linear、Slack和站会记录，定明天的议程、标出那些在Slack里口头说定却从没记进Linear的事、还盯着人对账。一个幕僚长跨两家生意外加农场杂活、按天气排日程。配置花了一小时，而OpenClaw要2到3天。

@catalinmpit [OpenClaw]

OpenClaw#8

https://x.com/catalinmpit/status/2066934168404299832

对"Hermes/OpenClaw没有使用场景"这句话的实诚回答：在它对你"咔哒"一下之前，它确实讲不通。他的agent什么都干，从简单的提醒到管钱、盯邮箱、改代码——全在Telegram上完成。它好100倍的原因不是某个单一功能，而是新对话一开，agent就已经掌握了关于他和他处境的全部上下文。他自己本地托管、带本地记忆，下一步打算让它从链接里直接下单。

@MartyBent [OpenClaw]

OpenClaw#9

https://x.com/MartyBent/status/2066878360135848026

他已经五个月没打开过Claude或Codex的桌面应用和CLI了，除了大约每月一次去debug他的OpenClaw设置。他是个"Telegram语音转文字"原教旨主义者：prompt就是2到5分钟的脑暴口述，照样产出高质量结果。他想说的比一个工作流技巧大——人和电脑交互的形态正在变，大多数人还卡在老的终端范式里，而做工具的人应该按这种语音优先的UX来设计。

@idoubicc [OpenClaw]

OpenClaw#10

https://x.com/idoubicc/status/2066810323450183792

他终于做了个让老婆爱不释手、天天高频用的产品——一个多角色陪伴agent。在fastclaw + shipany-next之上他做了WeClaw：工具加陪伴，揉了Manus、character.ai和OpenClaw的特性，扫码接进微信ClawBot。爆款角色叫"拽姐"，是他老婆照着自己的个性捏出来的；现在她每天跟拽姐聊生活、聊八卦，让拽姐督促自己学习。他承认完全不知道这类产品怎么赚钱——但能得到老婆的认可，也许算是一种成功。

@everestchris6 [OpenClaw]

OpenClaw#11

https://x.com/everestchris6/status/2066958065677824163

Claude Opus 4.8加OpenClaw，把一家餐厅的菜单照片变成客人能看、能定制、能下单的3D菜品模型，再给老板邮寄一张带二维码的明信片——全自动。完整的代理闭环：实时扫描一座城市里的每家餐厅，拉真实评论和食客上传的菜品照，把每道菜的照片变成可交互的3D模型，直接从照片里取品牌色，再寄出一张介绍他家招牌菜的实体明信片。获客、设计、触达，全折进了一次agent运行里。

@iam_elias1 [Claude Code]

#12

https://x.com/iam_elias1/status/2066949523554123993

一个Netflix工程师做了Headroom，一个开源代理，不改一行代码就把API账单砍掉最多95%，已经帮用户省了70万美元、释放了2000亿token。它干掉的问题是：agent调一次搜索工具回来500条结果，读一个日志回来1万行，查一次数据库回来一坨小说那么大的JSON——全被塞进上下文。Headroom在这些东西到达模型前先压缩、需要时再还原。一个用户把命令用"headroom wrap claude"包一下，就从每天200美元降到30美元。

@MichLieben [Claude Code]

Claude Code#13

https://x.com/MichLieben/status/2066899280791830710

他的agency跑的是"API驱动的GTM"：市场栈里几乎每个工具都是一个登录页包着一个真正干活的API，所以他们干脆跳过仪表盘。Claude Code读工具的API文档、发调用、自己修自己的错，而不是在界面里点来点去。他的增长负责人在Claude Code里现场重建了整条获客流程——建名单、做数据补全、写文案、灌进Instantly——全靠agent自己接上的API。他的论点是：仪表盘当年之所以存在，只是因为读文档需要一个工程师。

@Steve8708 [Claude Code]

Claude Code#14

https://x.com/Steve8708/status/2066906454704218337

Claude Code的plan模式很好，直到你对着终端里一大篇markdown长文眼神发直。于是他做了并开源了/visual-plan，一个把计划生成成带可视化、可交互组件的MDX的skill——图表、可交互的API规格、schema变更的diff、带注释的代码、甚至能拖能缩放的线框图。任何UI工作，你都能先看线框、评论、迭代，再开建。配套的/visual-recap则用来回看agent已经干了什么。

@kajikent [Claude Code]

Claude Code#15

https://x.com/kajikent/status/2066785527618285663

一个很小但很有共鸣的debug故事：每次Claude Code或Codex用Playwright，背后就整个起一台无头Chrome、然后不关、悄悄堆积。因为窗口是无头的、他平时用的浏览器又是Arc，他一直没察觉——直到Mac开始卡，他让Claude Code查，才把这堆东西揪出来。修法是：他在自己的Playwright skill里加了一步，任务结束前必须关掉浏览器、确认没有残留才算完成。最近觉得机器卡的人值得查一下。

@sekachov [Claude Code]

Claude Code#16

https://x.com/sekachov/status/2066956597029454113

一个误打误撞、但分量很重的发现：Claude Code不只在一个隐藏的Xcode模拟器里测iOS应用——测动画时它还会录屏、做逐帧拆解，全都悄悄存在/tmp/里。这个agent做的验证工作比用户以为的多，而且你可以自己去看证据。一个很好的提醒：harness的很多真实价值，在你去翻一翻之前都是看不见的。

@totoche [Claude Code]

Claude Code#17

https://x.com/totoche/status/2066957553452687529

他自己写了个macOS应用，就为了终于能合上Mac盖子而不让他的AI agent（Claude Code、Codex）半路停下。它拦住合盖休眠、让一切继续跑，合盖时锁屏、重开要密码，机器过热就自动休眠。他说这已经改变了他的日常——合上电脑，agent继续干活，屏幕还锁着。一个为特定目的造的小工具，它之所以存在，纯粹是因为长跑的agent打破了"合上电脑"这个老假设。

@humzaakhalid [Claude Code]

Claude Code#18

https://x.com/humzaakhalid/status/2066807970022006843

有人用Claude Code在7天里搭出了一整个"公司大脑"：一张活的、可点击的图，把每个部门、每个agent、每份SOP都摆在一个屏幕上。点一个节点，它就展开谁在管、挂了哪些SOP、每个人能碰什么。真正的关键是那个权限层——员工一打开聊天，AI就已经知道他的访问级别，只把他有权看的agent、数据和SOP浮出来。没有开发团队，没有半年工期，没有企业预算。

@om_patel5 [Claude Code]

#19

https://x.com/om_patel5/status/2066684683132493880

一个人厌倦了为查地理开十个标签页，于是vibe coding做了个app，把所有地图图层叠进一张能开能关的可交互地图里。柯本气候带、卫星影像、人口密度、夜间灯光、实时航班、海底光缆、各国民主指数——全在一个地方随手开关，而不是分散在十个网站上。一个干净的例子：agent把一个零散的日常烦恼收拢成了一个工具。

@itsolelehmann [Claude Code]

Claude Code#20

https://x.com/itsolelehmann/status/2066945778665292096

Claude Code对视频也好用，不止是代码。拍完一条片子后他手上有25个散乱的片段——文件名乱、开场镜头录在了最后——他直接让Claude拿他的脚本当大致参照去排序、剪掉静音、在发给剪辑之前把文件全重命名。它用wispr和ffmpeg从本地文件里扒出转写。听着很琐碎，但这活从至少一小时压到了两分钟。

@awawa_adhd [Claude Code]

Claude Code#21

https://x.com/awawa_adhd/status/2066875857256448160

一个对ADHD真有用的非编码模式：给自己建一份充实的"说明书"。因为这个诊断本质上是"适应不了当下的环境"，那对策就是把日常的想法和情绪记成一份说明书、围着它一点点优化自己的环境。他在Claude Code里搭了个记录系统，持续分析并更新这份说明书——还把"能开一家一人公司、过自己想过的日子"归功于它。

@koumei_ai5566 [Claude Code]

Claude Code#22

https://x.com/koumei_ai5566/status/2067031922380005619

真正起作用的不是编程能力——而是你能不能把自己的专业知识带进来，而且在全部十个职业门类里，跟工程师的差距都在7分以内。他是个快50岁、不会写代码、命令也搞不太懂的人。他就一直跟Claude Code说话、做skill，而用这些skill做出来的教材累计卖了超过一百万日元。现在他连信息收集都用Routines自动化了。他写的不是代码——是日语对话。

@takechan_lawyer [Claude Code]

Claude Code#23

https://x.com/takechan_lawyer/status/2066838768729121237

一个律师正要去给同行的定期学习会做分享，讲他怎么开发和卖两个app，幻灯片是他对着Claude Code（Opus 4.7）随口口述、它一次就把这堆语音变成了一份不错的演示稿。他答应全盘托出——怎么在本职法律工作之余一个人同时跑两个app开发，连营收数字都不藏。一个干净的专业服务领域数据点：非工程师在副业里把产品做出来了。

@aksjefokus [Claude Code]

Claude Code#24

https://x.com/aksjefokus/status/2066972595090505939

一个投资人打开Claude Code、跑了回测、看了它能做的分析之后给出的实诚判断：AI是范式转移，不是边际效率提升。他说没有它，自己绝写不出那么详细的、花12小时做的Meta分析。他给这个行业的结论很直接——基金经理应该围着Claude Code和agent去搭自己的工具和工作流，把它当成金融、编程和分析的学习引擎。

@ai_depression [OpenClaw]

#25

https://x.com/ai_depression/status/2066682099017666998

他靠一套"claude -p"自动化流程每月做3百万日元以上的营收，而昨天早上这套差点崩了。Anthropic本来计划的credit分离——从6月15日起把"claude -p"和第三方工具从订阅速率限制里剥离、转到单独的API credit——当天就被一封一行字的邮件撤回了。他整套流程（落地页生成、社媒发帖、评论，全自动）本会被卡住。他防御性的设计才是要点：他把一切都做成自建的Skill，这样平台一变也不会拆了他的流程。

@onusoz [OpenClaw]

OpenClaw#26

https://x.com/onusoz/status/2066810937198432628

一个具体的本地推理数据点：在英伟达GB10上用vLLM nightly跑nvidia/Qwen3.6-35B-A3B-NVFP4，4路并发能到50 tok/s——合计200 tok/s——他说这对生子agent或并行干活很理想。他对它的工具调用表现评价很高，打算在一个OpenClaw实例上试驾。这是"本地模型喂agent"这条路真正走到可用了。

@enhanced_jp [Claude Code]

Claude Code#27

https://x.com/enhanced_jp/status/2066765978697150869

他真的去读了那篇引爆"Claude Code 98%不是AI"说法背后的arXiv原论文，读出来的东西比标题有意思。核心确实是一个被重型机械包裹的简单while循环——权限模式、一个ML分类器、多段上下文压缩、worktree隔离的子agent。但帖子那句"只有Anthropic反着建了座要塞"是错的：建这套harness是所有做agent工具的人的必经之路，OpenAI的Codex CLI和Google的Gemini CLI（都开源）也把模型裹在同样的确定性机械里。要比就拿工具跟工具比。

@cihangxie [Claude Code]

#28

https://x.com/cihangxie/status/2066769682195951785

多模态agent进步很快，但真正部署是个噩梦：视频上传贵、帧冗余、prompt膨胀。他的答案是VisualClaw，一个不重训VLM就修掉系统设计瓶颈的框架——边缘级联过滤在设备端只留显著帧，冷热skill管理prompt膨胀，记忆引导的演化随时间变好。报出来的数字很猛：相比整帧上传最多砍98-99%成本，还带准确率提升，外加开放的benchmark和代码。

@shao__meng [Claude Code]

#29

https://x.com/shao__meng/status/2066687681200037904

对Addy Osmani那篇agentic代码审查文章的高密度总结，数据是重点。四个独立来源指向同一结论：代码产出涨了约4倍，但实际交付价值只多了约10%（另外90%是待验证的代码），代码churn涨了861%、缺陷率从9%升到54%，零审查合并的PR涨了31%、而审查时长涨了441%。结论不是"别审查了"——而是审查现在是软件里杠杆最高的能力，你的策略得取决于爆炸半径、代码寿命、以及有多少人需要看懂它。

@meyusufdemirci [Claude Code]

Claude Code#30

https://x.com/meyusufdemirci/status/2066856153909256477

一个很小、能马上用的技巧：Sentry在后端项目上很救命，遇到一个error时，打开它的详情，用"Copy as > Markdown"按钮抓一份干净的摘要，直接粘进Claude Code，最省力地把问题修了。他还补了一句：Sentry有MCP服务器，所以你能更进一步、做出由Claude Code驱动的自动化。就是那种悄悄复利的、零摩擦的集成。

@_MaxBlade [Claude Code]

Claude Code#31

https://x.com/_MaxBlade/status/2066916079838884249

他的app cnvs五天做了5700美元，主要靠"设计循环"做出来，他的主张是vibe coding的未来是循环。流程是：用Codex加GPT图像生成做出mockup，把mockup交给Claude Code，然后跑循环——截图、对比、迭代。结果是有手工感、值得付费的设计，而不是AI糊弄出来的东西。一个有营收背书的具体论点：把设计当成一个迭代的agent循环，而不是一次性prompt。

@RetroChainer [Claude Code]

Claude Code#32

https://x.com/RetroChainer/status/2066907011531333668

一篇greentext风格的实操，讲一个跑在大约每月30美元上的一人自动化音乐厂牌。用Suno付费版生成可直接发行的曲子（完整商用权），导出WAV和分轨，然后在发行文件夹里打开Claude Code：/bulk-metadata把标题、描述、标签写进一份干净的CSV，Python脚本整理文件、生成分发表，上传到DistroKid/Amuse，向Spotify编辑投递，再用一个脚本跑流媒体ROI分析。编程agent成了一个音乐生意的后台。

@0xSlyth [Claude Code]

Claude Code#33

https://x.com/0xSlyth/status/2066860841404928511

一个挑衅性的变现案例：一个25岁的人跑着一个完全AI驱动的OnlyFans人设，月入超过43,000美元，没相机、没拍摄、没内容团队。栈是这样——Claude Code管订阅者对话、内容排期和整套工作流自动化；Flux生成每一张图、预告和缩略图；ElevenLabs给它一个稳定的声音做语音。据说有订阅者花了近2000美元；人均营收约34美元。不管你怎么看，它就是一个agent在7×24地跑一门生意、对话里没有人。

@09pauai [Claude Code]

Claude Code#34

https://x.com/09pauai/status/2067023170046222599

一个少见地诚实的反面案例：他用Claude Code做了个算命产品、五分钟卖了9,980日元——然后不干了，三个原因。第一个：他根本不喜欢算命，是讨厌。卖一个毫无科学依据、自己都不信的东西，一点点把他磨没了；感谢是真的，但罪恶感更大。一个关于"agent变现的人性天花板"的罕见数据点——速度不是唯一重要的事。

🗣 用户心声

用户心声
成本是目前最响的主题。大家把token当成硬性设计约束——@dotey 看着一个简单任务生出31个agent、烧掉130万token，断定这根本不划算；@iam_elias1 推介的一个代理把某用户从每天200美元降到30美元。Anthropic自家数据也佐证了规模：据 @Kylechasse 对一项40万会话研究的解读，专家每条prompt的产出是新手的5倍。
大家想逃离终端。@MartyBent 五个月没打开过桌面应用和CLI，全靠Telegram语音工作；@catalinmpit 用同样的方式打理财务、邮箱和提醒，因为agent早就掌握了关于他的全部上下文。
他们要的是模型灵活，不是锁定——@onusoz 在GB10上本地跑Qwen3.6，就是为了喂一个OpenClaw实例，而不是按云端token付费。
平台稳定性是真实的担忧——@ai_depression 差点因为Anthropic那次（被撤回的）credit分离丢掉每月3百万日元的流程；@amandaorson 因为配置太痛而弃OpenClaw转投Hermes；框架的来回更替逼着人把自己的活做成可移植的Skill来隔离风险。
还有那条用血换来的共识：harness才是护城河。@yibie 转述的那本手册（"agent是干活的人，工程师确保agent能成功"）和 @enhanced_jp 对那篇Claude Code架构论文的解读，落点是同一个——价值在模型周围的机械里，不在prompt里。

📡 生态产品雷达

生态产品雷达
Codex —— 今天被搭配得最多的工具，反复和Claude Code并跑或互相handoff。
Hermes Agent / OpenClaw —— 运营、个人助理、B2B客户部署背后的自主agent层（Nous Research的Hermes是大家正在迁移过去的目的地）。
Ollama / vLLM —— 撑起"逃离云订阅"那波迁移的本地推理引擎。
Qwen3 / GLM-5.2 / DeepSeek —— 大家本地和省成本方案指向的开源权重模型。
Suno —— 一人自动化音乐厂牌背后的曲子生成器。
ElevenLabs —— AI网红、OnlyFans和管家方案里的声音。
Obsidian —— 反复出现、接进agent的记忆/知识库层。
Headroom —— 压缩agent上下文、把token账单砍掉最多95%的开源代理。

← 上一篇

SolonGate：一个会读你 Agent 下一步要干什么的保安

Loop 日报: 2026年6月18日

← 返回所有文章

加载中...

超级用户日报: 2026年6月18日

相关文章

评论