2026年6月17日super-user

超级用户日报: 2026年6月18日

今天最跳出来的模式,是键盘正在离开关键路径。一个Anthropic工程师把话说白了:如果你在盯着Claude写代码,你就是QA测试员,而这不是你的活。大家在用/loop过夜跑、用Routines脱离、在手机上驱动会话——而这几乎一切背后的硬约束是token成本:一个简单任务烧掉130万token、一个周末几百美元的账单,正把人逼向本地硬件。另一条主线是非编码工作:一条prompt产出一篇发表的论文、一个被裁的工程师把求职本身做成了agent流水线、一个老婆每天跟定制的陪伴agent聊天、一个投资人花12小时做的Meta分析。而在钱之下,认真的人反复念叨同一句——模型是租来的,harness才是护城河。
@hanakoxbt [Claude Code]
Claude Code#1
https://x.com/hanakoxbt/status/2066969072818872627
一个Anthropic的Claude Code工程师一句话把整个转变讲透了:如果你在盯着Claude写代码,那你就是QA测试员,而这不是你该拿钱干的事。37分钟里他讲的是怎么把键盘彻底踢出关键路径。/loop让Claude每10分钟醒一次替你盯PR,你人都不在电脑边;Routines在云上做同样的事、机器还能关着;远程控制让你在手机上驱动任意会话。键盘不再是瓶颈。
@yibie [Claude Code]
#2
https://x.com/yibie/status/2067013525298663433
一家跟他合作的创业公司把整本工程手册扔了,开了个作战室会议从零重建,第一条规则是:上午10点前不写代码。过去二十年工程文化都在追求最大化敲键盘的时间,这个团队反着来,每天上午一起pair prompt、定义目标、把agent设置到能成功为止。更深的翻转是那句宣言:现在干活的是agent,不是工程师——工程师的活是确保agent能把活干好。为agent这个首要用户设计,定义结果而不是过程,复核产出而不是代码。
@dotey [Claude Code]
Claude Code#3
https://x.com/dotey/status/2066777376399245356
一句很直接的token经济学抱怨,同时也是个警告:Claude Code的动态工作流在一个简单任务上一下生出31个agent、烧掉130万token,把他Pro 20x套餐的周用量从11%顶到20%。他的判断是这根本不划算——宁可慢点。这是对"放出一群agent"那种炒作的有用反例:agent越多不是免费的,账单是真的。
@nasqret [Claude Code]
Claude Code#4
https://x.com/nasqret/status/2066826720473223334
一个数学家全力押注"loop哲学"两周,拿出的前沿结果是实打实的,不是感觉。一个跑在Groebner基论文上的Codex循环重构了证明结构、把所有吃CPU的重计算都去掉,只留下人能手验的步骤。一个堆球循环用Python核对了Fisher的表格、还翻出了原工作漏掉的一个堆叠例子。还有一个Claude Code循环做了个GitHub演示,教高中老师agentic工作流。这是autoresearch在悄悄做真数学。
@MushtaqBilalPhD [Claude Code]
Claude Code#5
https://x.com/MushtaqBilalPhD/status/2066832015908118730
一个研究者让Claude Code从一条prompt里产出了一篇完整的研究论文——还带原创论点——他说Pangram判定100%人类写的,而且论文真的发表了。先把"骗检测器"那套争论放一边;值得注意的是,一个有真实学术分量的非编码知识产出,从一个编程agent里一次性出来了。他还给了一份可复现的分步教程。
@wecraveai [Claude Code]
Claude Code#6
https://x.com/wecraveai/status/2066807136672534876
一个人被裁了,在Claude Code上搭了套AI求职系统、用它评估了740多个岗位、拿下了一个Head of Applied AI的offer,然后把整套东西开源成career-ops。一条斜杠命令就把一个职位链接变成一份A到F的结构化评估、一份针对这个岗位的ATS优化PDF(用Playwright渲染)、薪资调研、面试准备、外加一条追踪记录。14种skill模式、一个能扫45家以上公司门户的扫描器、用Claude子agent做批量评估。这是把求职本身变成了一条agent流水线。
@amandaorson [OpenClaw]
OpenClaw#7
https://x.com/amandaorson/status/2066927382783504598
从OpenClaw换到了Nous Research的Hermes,用法纯是运营,不是编码。一份日报(配上Last 30 Days这个skill)每天早上把房地产投资者的痛点从X、Reddit、YouTube上捞出来。一个项目管理agent读Linear、Slack和站会记录,定明天的议程、标出那些在Slack里口头说定却从没记进Linear的事、还盯着人对账。一个幕僚长跨两家生意外加农场杂活、按天气排日程。配置花了一小时,而OpenClaw要2到3天。
@catalinmpit [OpenClaw]
OpenClaw#8
https://x.com/catalinmpit/status/2066934168404299832
对"Hermes/OpenClaw没有使用场景"这句话的实诚回答:在它对你"咔哒"一下之前,它确实讲不通。他的agent什么都干,从简单的提醒到管钱、盯邮箱、改代码——全在Telegram上完成。它好100倍的原因不是某个单一功能,而是新对话一开,agent就已经掌握了关于他和他处境的全部上下文。他自己本地托管、带本地记忆,下一步打算让它从链接里直接下单。
@MartyBent [OpenClaw]
OpenClaw#9
https://x.com/MartyBent/status/2066878360135848026
他已经五个月没打开过Claude或Codex的桌面应用和CLI了,除了大约每月一次去debug他的OpenClaw设置。他是个"Telegram语音转文字"原教旨主义者:prompt就是2到5分钟的脑暴口述,照样产出高质量结果。他想说的比一个工作流技巧大——人和电脑交互的形态正在变,大多数人还卡在老的终端范式里,而做工具的人应该按这种语音优先的UX来设计。
@idoubicc [OpenClaw]
OpenClaw#10
https://x.com/idoubicc/status/2066810323450183792
他终于做了个让老婆爱不释手、天天高频用的产品——一个多角色陪伴agent。在fastclaw + shipany-next之上他做了WeClaw:工具加陪伴,揉了Manus、character.ai和OpenClaw的特性,扫码接进微信ClawBot。爆款角色叫"拽姐",是他老婆照着自己的个性捏出来的;现在她每天跟拽姐聊生活、聊八卦,让拽姐督促自己学习。他承认完全不知道这类产品怎么赚钱——但能得到老婆的认可,也许算是一种成功。
@everestchris6 [OpenClaw]
OpenClaw#11
https://x.com/everestchris6/status/2066958065677824163
Claude Opus 4.8加OpenClaw,把一家餐厅的菜单照片变成客人能看、能定制、能下单的3D菜品模型,再给老板邮寄一张带二维码的明信片——全自动。完整的代理闭环:实时扫描一座城市里的每家餐厅,拉真实评论和食客上传的菜品照,把每道菜的照片变成可交互的3D模型,直接从照片里取品牌色,再寄出一张介绍他家招牌菜的实体明信片。获客、设计、触达,全折进了一次agent运行里。
@iam_elias1 [Claude Code]
#12
https://x.com/iam_elias1/status/2066949523554123993
一个Netflix工程师做了Headroom,一个开源代理,不改一行代码就把API账单砍掉最多95%,已经帮用户省了70万美元、释放了2000亿token。它干掉的问题是:agent调一次搜索工具回来500条结果,读一个日志回来1万行,查一次数据库回来一坨小说那么大的JSON——全被塞进上下文。Headroom在这些东西到达模型前先压缩、需要时再还原。一个用户把命令用"headroom wrap claude"包一下,就从每天200美元降到30美元。
@MichLieben [Claude Code]
Claude Code#13
https://x.com/MichLieben/status/2066899280791830710
他的agency跑的是"API驱动的GTM":市场栈里几乎每个工具都是一个登录页包着一个真正干活的API,所以他们干脆跳过仪表盘。Claude Code读工具的API文档、发调用、自己修自己的错,而不是在界面里点来点去。他的增长负责人在Claude Code里现场重建了整条获客流程——建名单、做数据补全、写文案、灌进Instantly——全靠agent自己接上的API。他的论点是:仪表盘当年之所以存在,只是因为读文档需要一个工程师。
@Steve8708 [Claude Code]
Claude Code#14
https://x.com/Steve8708/status/2066906454704218337
Claude Code的plan模式很好,直到你对着终端里一大篇markdown长文眼神发直。于是他做了并开源了/visual-plan,一个把计划生成成带可视化、可交互组件的MDX的skill——图表、可交互的API规格、schema变更的diff、带注释的代码、甚至能拖能缩放的线框图。任何UI工作,你都能先看线框、评论、迭代,再开建。配套的/visual-recap则用来回看agent已经干了什么。
@kajikent [Claude Code]
Claude Code#15
https://x.com/kajikent/status/2066785527618285663
一个很小但很有共鸣的debug故事:每次Claude Code或Codex用Playwright,背后就整个起一台无头Chrome、然后不关、悄悄堆积。因为窗口是无头的、他平时用的浏览器又是Arc,他一直没察觉——直到Mac开始卡,他让Claude Code查,才把这堆东西揪出来。修法是:他在自己的Playwright skill里加了一步,任务结束前必须关掉浏览器、确认没有残留才算完成。最近觉得机器卡的人值得查一下。
@sekachov [Claude Code]
Claude Code#16
https://x.com/sekachov/status/2066956597029454113
一个误打误撞、但分量很重的发现:Claude Code不只在一个隐藏的Xcode模拟器里测iOS应用——测动画时它还会录屏、做逐帧拆解,全都悄悄存在/tmp/里。这个agent做的验证工作比用户以为的多,而且你可以自己去看证据。一个很好的提醒:harness的很多真实价值,在你去翻一翻之前都是看不见的。
@totoche [Claude Code]
Claude Code#17
https://x.com/totoche/status/2066957553452687529
他自己写了个macOS应用,就为了终于能合上Mac盖子而不让他的AI agent(Claude Code、Codex)半路停下。它拦住合盖休眠、让一切继续跑,合盖时锁屏、重开要密码,机器过热就自动休眠。他说这已经改变了他的日常——合上电脑,agent继续干活,屏幕还锁着。一个为特定目的造的小工具,它之所以存在,纯粹是因为长跑的agent打破了"合上电脑"这个老假设。
@humzaakhalid [Claude Code]
Claude Code#18
https://x.com/humzaakhalid/status/2066807970022006843
有人用Claude Code在7天里搭出了一整个"公司大脑":一张活的、可点击的图,把每个部门、每个agent、每份SOP都摆在一个屏幕上。点一个节点,它就展开谁在管、挂了哪些SOP、每个人能碰什么。真正的关键是那个权限层——员工一打开聊天,AI就已经知道他的访问级别,只把他有权看的agent、数据和SOP浮出来。没有开发团队,没有半年工期,没有企业预算。
@om_patel5 [Claude Code]
#19
https://x.com/om_patel5/status/2066684683132493880
一个人厌倦了为查地理开十个标签页,于是vibe coding做了个app,把所有地图图层叠进一张能开能关的可交互地图里。柯本气候带、卫星影像、人口密度、夜间灯光、实时航班、海底光缆、各国民主指数——全在一个地方随手开关,而不是分散在十个网站上。一个干净的例子:agent把一个零散的日常烦恼收拢成了一个工具。
@itsolelehmann [Claude Code]
Claude Code#20
https://x.com/itsolelehmann/status/2066945778665292096
Claude Code对视频也好用,不止是代码。拍完一条片子后他手上有25个散乱的片段——文件名乱、开场镜头录在了最后——他直接让Claude拿他的脚本当大致参照去排序、剪掉静音、在发给剪辑之前把文件全重命名。它用wispr和ffmpeg从本地文件里扒出转写。听着很琐碎,但这活从至少一小时压到了两分钟。
@awawa_adhd [Claude Code]
Claude Code#21
https://x.com/awawa_adhd/status/2066875857256448160
一个对ADHD真有用的非编码模式:给自己建一份充实的"说明书"。因为这个诊断本质上是"适应不了当下的环境",那对策就是把日常的想法和情绪记成一份说明书、围着它一点点优化自己的环境。他在Claude Code里搭了个记录系统,持续分析并更新这份说明书——还把"能开一家一人公司、过自己想过的日子"归功于它。
@koumei_ai5566 [Claude Code]
Claude Code#22
https://x.com/koumei_ai5566/status/2067031922380005619
真正起作用的不是编程能力——而是你能不能把自己的专业知识带进来,而且在全部十个职业门类里,跟工程师的差距都在7分以内。他是个快50岁、不会写代码、命令也搞不太懂的人。他就一直跟Claude Code说话、做skill,而用这些skill做出来的教材累计卖了超过一百万日元。现在他连信息收集都用Routines自动化了。他写的不是代码——是日语对话。
@takechan_lawyer [Claude Code]
Claude Code#23
https://x.com/takechan_lawyer/status/2066838768729121237
一个律师正要去给同行的定期学习会做分享,讲他怎么开发和卖两个app,幻灯片是他对着Claude Code(Opus 4.7)随口口述、它一次就把这堆语音变成了一份不错的演示稿。他答应全盘托出——怎么在本职法律工作之余一个人同时跑两个app开发,连营收数字都不藏。一个干净的专业服务领域数据点:非工程师在副业里把产品做出来了。
@aksjefokus [Claude Code]
Claude Code#24
https://x.com/aksjefokus/status/2066972595090505939
一个投资人打开Claude Code、跑了回测、看了它能做的分析之后给出的实诚判断:AI是范式转移,不是边际效率提升。他说没有它,自己绝写不出那么详细的、花12小时做的Meta分析。他给这个行业的结论很直接——基金经理应该围着Claude Code和agent去搭自己的工具和工作流,把它当成金融、编程和分析的学习引擎。
@ai_depression [OpenClaw]
#25
https://x.com/ai_depression/status/2066682099017666998
他靠一套"claude -p"自动化流程每月做3百万日元以上的营收,而昨天早上这套差点崩了。Anthropic本来计划的credit分离——从6月15日起把"claude -p"和第三方工具从订阅速率限制里剥离、转到单独的API credit——当天就被一封一行字的邮件撤回了。他整套流程(落地页生成、社媒发帖、评论,全自动)本会被卡住。他防御性的设计才是要点:他把一切都做成自建的Skill,这样平台一变也不会拆了他的流程。
@onusoz [OpenClaw]
OpenClaw#26
https://x.com/onusoz/status/2066810937198432628
一个具体的本地推理数据点:在英伟达GB10上用vLLM nightly跑nvidia/Qwen3.6-35B-A3B-NVFP4,4路并发能到50 tok/s——合计200 tok/s——他说这对生子agent或并行干活很理想。他对它的工具调用表现评价很高,打算在一个OpenClaw实例上试驾。这是"本地模型喂agent"这条路真正走到可用了。
@enhanced_jp [Claude Code]
Claude Code#27
https://x.com/enhanced_jp/status/2066765978697150869
他真的去读了那篇引爆"Claude Code 98%不是AI"说法背后的arXiv原论文,读出来的东西比标题有意思。核心确实是一个被重型机械包裹的简单while循环——权限模式、一个ML分类器、多段上下文压缩、worktree隔离的子agent。但帖子那句"只有Anthropic反着建了座要塞"是错的:建这套harness是所有做agent工具的人的必经之路,OpenAI的Codex CLI和Google的Gemini CLI(都开源)也把模型裹在同样的确定性机械里。要比就拿工具跟工具比。
@cihangxie [Claude Code]
#28
https://x.com/cihangxie/status/2066769682195951785
多模态agent进步很快,但真正部署是个噩梦:视频上传贵、帧冗余、prompt膨胀。他的答案是VisualClaw,一个不重训VLM就修掉系统设计瓶颈的框架——边缘级联过滤在设备端只留显著帧,冷热skill管理prompt膨胀,记忆引导的演化随时间变好。报出来的数字很猛:相比整帧上传最多砍98-99%成本,还带准确率提升,外加开放的benchmark和代码。
@shao__meng [Claude Code]
#29
https://x.com/shao__meng/status/2066687681200037904
对Addy Osmani那篇agentic代码审查文章的高密度总结,数据是重点。四个独立来源指向同一结论:代码产出涨了约4倍,但实际交付价值只多了约10%(另外90%是待验证的代码),代码churn涨了861%、缺陷率从9%升到54%,零审查合并的PR涨了31%、而审查时长涨了441%。结论不是"别审查了"——而是审查现在是软件里杠杆最高的能力,你的策略得取决于爆炸半径、代码寿命、以及有多少人需要看懂它。
@meyusufdemirci [Claude Code]
Claude Code#30
https://x.com/meyusufdemirci/status/2066856153909256477
一个很小、能马上用的技巧:Sentry在后端项目上很救命,遇到一个error时,打开它的详情,用"Copy as > Markdown"按钮抓一份干净的摘要,直接粘进Claude Code,最省力地把问题修了。他还补了一句:Sentry有MCP服务器,所以你能更进一步、做出由Claude Code驱动的自动化。就是那种悄悄复利的、零摩擦的集成。
@_MaxBlade [Claude Code]
Claude Code#31
https://x.com/_MaxBlade/status/2066916079838884249
他的app cnvs五天做了5700美元,主要靠"设计循环"做出来,他的主张是vibe coding的未来是循环。流程是:用Codex加GPT图像生成做出mockup,把mockup交给Claude Code,然后跑循环——截图、对比、迭代。结果是有手工感、值得付费的设计,而不是AI糊弄出来的东西。一个有营收背书的具体论点:把设计当成一个迭代的agent循环,而不是一次性prompt。
@RetroChainer [Claude Code]
Claude Code#32
https://x.com/RetroChainer/status/2066907011531333668
一篇greentext风格的实操,讲一个跑在大约每月30美元上的一人自动化音乐厂牌。用Suno付费版生成可直接发行的曲子(完整商用权),导出WAV和分轨,然后在发行文件夹里打开Claude Code:/bulk-metadata把标题、描述、标签写进一份干净的CSV,Python脚本整理文件、生成分发表,上传到DistroKid/Amuse,向Spotify编辑投递,再用一个脚本跑流媒体ROI分析。编程agent成了一个音乐生意的后台。
@0xSlyth [Claude Code]
Claude Code#33
https://x.com/0xSlyth/status/2066860841404928511
一个挑衅性的变现案例:一个25岁的人跑着一个完全AI驱动的OnlyFans人设,月入超过43,000美元,没相机、没拍摄、没内容团队。栈是这样——Claude Code管订阅者对话、内容排期和整套工作流自动化;Flux生成每一张图、预告和缩略图;ElevenLabs给它一个稳定的声音做语音。据说有订阅者花了近2000美元;人均营收约34美元。不管你怎么看,它就是一个agent在7×24地跑一门生意、对话里没有人。
@09pauai [Claude Code]
Claude Code#34
https://x.com/09pauai/status/2067023170046222599
一个少见地诚实的反面案例:他用Claude Code做了个算命产品、五分钟卖了9,980日元——然后不干了,三个原因。第一个:他根本不喜欢算命,是讨厌。卖一个毫无科学依据、自己都不信的东西,一点点把他磨没了;感谢是真的,但罪恶感更大。一个关于"agent变现的人性天花板"的罕见数据点——速度不是唯一重要的事。
🗣 用户心声
用户心声
成本是目前最响的主题。大家把token当成硬性设计约束——@dotey 看着一个简单任务生出31个agent、烧掉130万token,断定这根本不划算;@iam_elias1 推介的一个代理把某用户从每天200美元降到30美元。Anthropic自家数据也佐证了规模:据 @Kylechasse 对一项40万会话研究的解读,专家每条prompt的产出是新手的5倍。
大家想逃离终端。@MartyBent 五个月没打开过桌面应用和CLI,全靠Telegram语音工作;@catalinmpit 用同样的方式打理财务、邮箱和提醒,因为agent早就掌握了关于他的全部上下文。
他们要的是模型灵活,不是锁定——@onusoz 在GB10上本地跑Qwen3.6,就是为了喂一个OpenClaw实例,而不是按云端token付费。
平台稳定性是真实的担忧——@ai_depression 差点因为Anthropic那次(被撤回的)credit分离丢掉每月3百万日元的流程;@amandaorson 因为配置太痛而弃OpenClaw转投Hermes;框架的来回更替逼着人把自己的活做成可移植的Skill来隔离风险。
还有那条用血换来的共识:harness才是护城河。@yibie 转述的那本手册("agent是干活的人,工程师确保agent能成功")和 @enhanced_jp 对那篇Claude Code架构论文的解读,落点是同一个——价值在模型周围的机械里,不在prompt里。
📡 生态产品雷达
生态产品雷达
Codex —— 今天被搭配得最多的工具,反复和Claude Code并跑或互相handoff。
Hermes Agent / OpenClaw —— 运营、个人助理、B2B客户部署背后的自主agent层(Nous Research的Hermes是大家正在迁移过去的目的地)。
Ollama / vLLM —— 撑起"逃离云订阅"那波迁移的本地推理引擎。
Qwen3 / GLM-5.2 / DeepSeek —— 大家本地和省成本方案指向的开源权重模型。
Suno —— 一人自动化音乐厂牌背后的曲子生成器。
ElevenLabs —— AI网红、OnlyFans和管家方案里的声音。
Obsidian —— 反复出现、接进agent的记忆/知识库层。
Headroom —— 压缩agent上下文、把token账单砍掉最多95%的开源代理。
← 上一篇
SolonGate:一个会读你 Agent 下一步要干什么的保安
下一篇 →
Loop 日报: 2026年6月18日
← 返回所有文章

评论

加载中...
>_