2026年6月27日super-user

超级用户日报: 2026年6月28日

这周的重心变了。最响的那些 Claude Code 故事,已经不是关于写代码,而是关于有人把一个终端对准了过去需要一整家公司才能干的活。一个独立开发者用口袋里的手机跑着七个 agent 的建站工作室。一个测量员拿着激光雷达扫描仪在房子周围走一圈,按 300 美元一小时收费,而过去一支测量队要价 8000 美元。一个税务会计一个人悄悄管着 60 家公司。把它们串起来的逻辑是同一个:模型不再是聊天机器人,而是变成了一个你可以扭头走开、让它自己跑下去的 harness。今天另一半的内容是让这一切成为可能的管道——记忆层、自我验证的循环、token 代理——外加一股新冒出来的安全焦虑,因为大家开始意识到,一个能读你 Sentry 报错的 agent,也能被这些报错指挥着去干事。下面是真实用户这两天实际做出来的东西。
@ParamSiddh [Claude Code]
Claude Code#1
https://x.com/ParamSiddh/status/2070538133507309906
今年最干净的一人公司案例。一个中国开发者搭了七个 Claude Code agent——Scout、Diagnoser、Builder、Filmer、Pitcher、Checker,外加一个住在 iPhone 里的 Mobile agent——去找本地没网站的小生意,自动生成 mockup、渲染 10 秒推销视频、四个渠道群发冷启动消息。整套东西 24 小时跑在一个本地沙箱、一个 MCP 路由和靠文件系统共享的状态上。没有后端,没有团队。真实日志:在 Austin、Denver、Miami 扫了 218 家店,发 30 条消息,5 条正面回复,约到 3 个 Zoom。每月 480 美元 API 花费,对应 18800 美元收入。老板唯一要做的就是点"批准"然后去开会。
@milesdeutscher [Claude Code]
#2
https://x.com/milesdeutscher/status/2070428106805203014
做了个 AI 世界杯预测终端,昨天命中率 91.7%,12 场对了 11 场。有意思的不是赌注,是架构:他没用第三方 API,而是直接连 Polygon RPC,从链上读取每一笔 Polymarket 交易,把原始日志解码成干净的交易对象,再让 Claude 做筛选——大额买入、重复钱包、情绪反转,还加了去重防止信息流被淹。两周试错,六个核心组件,部署到常驻的 Vercel。空闲时他会暂停,因为跑一小时大概要 40 美元。
@browomo [Claude Code]
Claude Code#3
https://x.com/browomo/status/2070581623922299279
有人用一台大疆经纬 M350 RTK 无人机加一条跑在 Claude Code 上的五模块流水线,替掉了 8000 美元的测量队,全部由一个 orchestrator 统筹,全是他一个人搭的。无人机飞航线,禅思 L2 激光把几何精度记录到厘米级,DJI Terra 把点云拼成数字孪生,一个 Claude agent 直接产出客户要的东西——方量报告、进度对比、一个能在浏览器里旋转的模型链接。一个工地大约一小时变成一个文件。他的成本就是一块电池加每月约 300 美元的模型托管。这条流水线甚至只在飞漏了某块地方时才用语音叫他。
@v_nefodov [Claude Code]
Claude Code#4
https://x.com/v_nefodov/status/2070649055781249196
另一个测量故事,同样犀利。他把测量资质、一台 ZEB Horizon 手持激光雷达扫描仪和 Claude Code 组合起来。绕着房子走一圈,每秒采集数百万个空间点,再把点云丢进他用 Claude Code 搭的处理流水线,直接吐出带测量数据、3D 渲染和边界文档的完整报告。过去测量公司要两周的活,他一个人两天搞定。一周四个房产,每小时 300 美元。Claude 没有替掉这门手艺——它让一个有这门手艺的人,值一整家公司的价。
@kandmybike [Claude Code]
Claude Code#5
https://x.com/kandmybike/status/2070469002980421961
一个税务会计正在做他口中的"一人 AI 税理士"——把 freee 的记账自动化接到 Claude Code 上,让一个人加 AI 就能高质量服务几十家公司。他围绕这套东西开了三个月训练营,而他自己的资历就是证明:他一个人管 60 家公司。这才是没人发段子调侃的那种安静版 AI 颠覆——不是替掉会计本人,而是替掉过去坐在一个会计身后那一群初级员工。
@duborges [Claude Code]
Claude Code#6
https://x.com/duborges/status/2070469806612951298
一个真正聪明的办法,让 fintech 跑 Claude Code,又不用装任何来路不明的"claw"包。他开了台每月 20 美元的 VPS,用 Tailscale 锁死外网访问,再用 Slack Bolt 接了个叫 DOLA 的机器人——输入 /session [消息] 就启动一个全新的 Claude Code 并注入指令。VPS 没有数据库直连权限,而是去调主服务器的接口。最杀的例子:以前 KYC 填错邮编要为每种错误硬编码一个处理逻辑,现在 agent 直接读报错、用正确数据重试。他和一个联合创始人就靠这个,三个月做出一家有 100 多个客户的盈利 fintech。
@0xWast3 [Claude Code]
Claude Code#7
https://x.com/0xWast3/status/2070435871866675250
一位 68 岁的退休老人,当了 35 年系统工程师,死活不肯把数据放云端——于是他搭了个完全离线的 AI 助手。买了台 GMKtec 迷你主机,抹掉 Windows,装上 Ubuntu 和 Ollama,把一个本地 Claude Code 实例指向自己的机器。然后接到一台跑着各种自动化的树莓派上:日程提醒、晨间简报、文档整理,全部语音触发。没订阅,数据不出门,配置完之后连网都不用。他的收件箱被其他退休老人挤爆,都在问怎么照着做一个。
@0xrabi_ [Claude Code]
Claude Code#8
https://x.com/0xrabi_/status/2070523595659374905
我反复回味的一个故事。一个电工在电话里说:"我 vibe coding 三个月了,捡了台旧电脑跑工具和 Claude Code 来简化流程。我给自己做了个热记忆和冷记忆——报价、工地管理啥的全简化了。"没有开发背景,就是一颗灵光的脑子加上足够的胆量去解决自己的痛点。这才是真正的前沿——不是工程师做应用,而是手艺人因为试错成本终于归零,开始给自己造软件。
@d33v33d0 [Claude Code]
Claude Code#9
https://x.com/d33v33d0/status/2070380565086470144
用 Claude Code 加 Opus 4.8 实际操控一台拆卡车的机器人。难点在于 Claude 没有深度感知,所以他在卡车周围架了一圈摄像头,每动一下就让 Claude 分析画面。他最妙的经验特别土:大量用颜色。Opus 读图看到的是像素,所以他在关节处贴更多警示胶带、在棚子上喷红色标记,帮它追踪物体。光是掰断椽子上的一根 2x4,现在就要 20 多分钟的反复定位——慢,但能跑,他正在做一个自定义 harness 来提速。
@plutos_eth [Claude Code]
Claude Code#10
https://x.com/plutos_eth/status/2070569868559081789
一个自动化代运营公司创始人用 Claude Code 做了个"贾维斯"——先给自己用,现在转卖给房产客户。半夜来一条新询盘:它筛选线索、对着日历预约看房、更新 CRM,在所有人醒来之前追完缺失的材料。重点在定位——不是一条自动化工作流,而是一个跑整个生意的系统。代运营的打法正在从"我们帮你干活"变成"我们把那个干活的卖给你"。
@aakashgupta [Claude Code]
Claude Code#11
https://x.com/aakashgupta/status/2070367524139745327
对 PM 角色正在分裂的清晰观察。一拨人整天泡在 Slack 里——"能发我 Gong 录音吗""多少客户提了这个需求"——四条消息才能记录清楚一个需求。另一拨人把整个环节自动化了:每个进来的需求走结构化录入,客户影响和历史预先填好,PM 看到的是一个分好类的队列,而不是一串对话。他说在那些把整个公司跑在 Claude Code 上的亿元级创业公司里,这已经在发生。系统不是替掉 PM 的判断,而是把判断捕捉下来,规模化执行。
@aakashgupta [Claude Code]
Claude Code#12
https://x.com/aakashgupta/status/2070517939833635228
配套的另一篇,结论更猛:在一家高速增长的创业公司,PM 不只是定义功能,还在交付前端和后端——不是因为学会了写代码,而是因为学会了审代码。PM 打开一个仓库,让 Claude Code 评估代码库,就能得到关于风险集中在哪、哪些部分真需要资深工程师把关的真实答案。旧标准是"和工程师协作去理解风险",新标准是"自己评估,只在真有争议的地方拉工程师进来"。客户成功团队现在也在交付。
@moritzkremb [Claude Code]
Claude Code#13
https://x.com/moritzkremb/status/2070515065670046133
一段紧凑的演示,一个生意的"第二大脑加操作系统",装着他全部上下文和记忆,自己跑活:每天早上给销售电话打分,从视频里写出 newsletter,搭建并上传 Meta 广告,跨平台排期内容。同一套东西在 Claude Code 或 Codex 里都能跑。没有长篇大论——就是一屏看清一个单干者的公司在 OS 当员工时到底长什么样。
@fukuda_CEO [Claude Code]
Claude Code#14
https://x.com/fukuda_CEO/status/2070370500577259711
一个关于 AI 视频的诚实判断,戳破大多数人的吹嘘:免费 AI 剪辑基本是低质量垃圾,但有一个特定组合让他改了主意——Gemini Omni × GPT Images 2 × Claude Code。丢一张产品图加一句话定位进去,它自动提四个广告概念、生成脚本、加配音、导出竖版视频。12 分钟,430 日元。他说质量和过去外包一条 3 万日元的水平没差。让人信服的正是这种判断——他点名了具体哪些工具,也老实承认免费 AI 还差在哪。
@0xQiYan [Claude Code]
Claude Code#15
https://x.com/0xQiYan/status/2070407326100849059
AI Berkshire——一个把 Claude 变成投研工具的开源项目。给它一个公司名,它并行起多个 AI 角色——巴菲特、芒格、段永平、李录——用四种风格交叉拷问同一家公司,然后强制给出带参考价格区间的具体结论,而不是那种"可能、也许"的稀泥。16 个研究 skill,覆盖深度研究、财报解读、行业筛选、持仓管理。装好后把 skill 拷进 Claude Code 命令目录,直接 /investment-research 腾讯。他没验证过实盘收益,并且明说了。
@lowesyang [Claude Code]
Claude Code#16
https://x.com/lowesyang/status/2070538219566067994
Minara 把 Claude Code 用在编码上的那套循环,搬到了量化交易。从 200 多个因子的库里挑因子,用提示词生成策略,让 agent 根据回测迭代,在实盘里验证——然后再跑一遍循环。定位很清楚:研究、生成、判断、保留或丢弃、重复,全在一个地方。这就是 agentic loop 模式走出软件、直接踏进金融。
@alphabatcher [Claude Code]
Claude Code#17
https://x.com/alphabatcher/status/2070531462877626688
交易循环的犀利之处:在软件里,一个 loop 可以每 30 分钟看 PR、修 CI,但一旦涉及真金白银,券商 API 前面必须有一道硬关卡。他的 loop 在下单前要过四关——这个想法扛住了新的回测吗、在样本外数据上站得住吗、最大回撤守住规则了吗、今天是不是被财报、FOMC 或仓位上限挡住。全部价值就在那个卡在研究和执行之间的检查器。这就是怎么把 Claude Code 从研究助手变成一个能拒绝交易的量化系统。
@koujikano1 [Claude Code]
Claude Code#18
https://x.com/koujikano1/status/2070457382166306839
一个自制赛马预测 AI,周末押注 100 万日元,在博客上贴出按置信度分档的真实回收率。藏在里面的是本周少有的诚实成本评估:对于这类非编码的分析工作,Claude Code 每月 3 万日元到底值不值。不吹,就是一个爱好者把自己的模型当投资在做,并且把账单亮出来。
@naruto11eth [Claude Code]
Claude Code#19
https://x.com/naruto11eth/status/2070622407446925685
本周最有人味的用法,就一行:把你最近五段感情的聊天记录导出来,丢进 Claude Code,让它给你做心理分析,解释每一段为什么没走下去。是条随手发的推,但它指向一件真事——当一个编码 agent 能读任意文本文件的那一刻,它就成了读你自己的工具,而不只是读你的代码库。
@bonduelleioat [Claude Code]
Claude Code#20
https://x.com/bonduelleioat/status/2070540254692425835
一个 25 岁、毫无设计和编码背景的人,投了 300 美元,靠一个每月 20 美元的 Claude 订阅,第一个月净赚 7000 美元跑了一整个服装品牌。AI 生成印花概念和变体,写文案和广告语,Claude Code 在几小时内写出并调通店铺,做成能用的 MVP。他还是需要烫画机、打印机和一小批测试 T 恤——实体那一半是真的——但整个数字那一半现在归 AI。他的判断:资本不再是最贵的资源,执行速度才是。
@0xbeinginvested [Claude Code]
#21
https://x.com/0xbeinginvested/status/2070422387896586425
一个免费的 SEO 审计 skill,60 秒做完代理商收 5000 美元的活。输入 /seo-audit,丢上网址,它并行跑六个 agent——技术 SEO、内容、schema、站点地图、性能、视觉——做 13 项检查,再给你打个百分制的分。他的初始分是 57。代理商不愿碰的那部分:它还审你在 ChatGPT、Perplexity 和 Google AI Overviews 里的表现,不只是传统搜索。几分钟后他的分数冲到 95。
@Veltrxai [Claude Code]
Claude Code#22
https://x.com/Veltrxai/status/2070524828021293119
一个客户花 4 万美元买了个建在 Obsidian 里的 AI"第二大脑"——不是聊天机器人,是一个跑生意的 wiki。完整六步:把 Claude Code 指向一个 Obsidian 仓库,一个提示词建好文件夹树和一份装着业务上下文的 CLAUDE.md,把原始文件拖进去让 Claude 改写成带引用来源的链接笔记,用 MCP 接 Gmail/日历/Drive,存一个可复用的"每周简报"skill,并行起三个便宜的子 agent 扫风险,最后排期并锁权限。最后一步是大多数人会跳过的:一个简单的 UI 层,因为不懂技术的客户永远不会打开 Claude Code,而那个界面正是他花 4 万买的东西。
@fuxps32 [Claude Code]
Claude Code#23
https://x.com/fuxps32/status/2070306357266583942
同样的第二大脑,外加一个驾驶舱。他把 Claude Code 指向自己的 Obsidian 仓库,让它统筹全局,现在一屏看清一切:376 条笔记分布在 32 个簇里,成熟度 58%,速度 +196%,还排出他的核心枢纽——那些他笔记反复绕回去的想法。每周 Claude 标出哪些在变冷、哪里需要一座桥。大多数人存了笔记就忘了它们存在,他给自己的笔记装了个控制面板。
@Veltrxai [Claude Code]
Claude Code#24
https://x.com/Veltrxai/status/2070610014885327114
关于 Obsidian 为什么在 AI 工作上吊打 Notion,这是最清楚的论证:你的 Notion 笔记在云端,所以你笔记本上的 agent 碰不到,除非租 Notion 自家的 AI 或接一个有速率限制的 API。Obsidian 笔记就是文件夹里的 Markdown 文件——把路径交给 Claude Code,它当场读、分析、改写。他点出的解锁时刻:有人让 Claude 找出藏在最多笔记里的那一个想法,它翻出一条悄悄串起健身、学习、投资笔记的线索——三个他自己从没连起来的领域。
@KingBootoshi [Claude Code]
#25
https://x.com/KingBootoshi/status/2070517837450674366
一个论证有力的观点:别再给 agent 塞 MCP 了,给它 CLI。你可以给 agent 装 100 个 CLI 工具,但塞五个 MCP 它就被上下文腐烂搞崩了——而所有模型本来就在终端命令上训练过。他的诀窍:给 agent 配带帮助向导的 CLI 工具,让它当场学会用。最妙的是把错误输出当提示词——如果报错说清了问题和怎么改,agent 当场就自我纠正。对 MCP 极度看空,而且他把这笔效率账算得让人没法反驳。
@zodchiii [Claude Code]
Claude Code#26
https://x.com/zodchiii/status/2070444119051157559
Anthropic 发了份 PDF,讲自己团队到底怎么用 Claude Code,这是干净的拆解:Spec、Dispatch、Verify、Systemize。Spec——给 Claude 一个清晰目标让它跑,而不是逐行打字。Dispatch——增长团队把活拆给子 agent,几分钟出几百份产出。Verify——Claude 自己跑构建、测试、lint,信任来自证据。Systemize——重复的工作流变成命令,其中 50% 是安全团队写的。核心洞察:他们的工程师不是写更多代码,而是把系统搭好,然后审 Claude 自己交付的那 80%。
@BenceRedmond [Claude Code]
Claude Code#27
https://x.com/BenceRedmond/status/2070349545989414983
几周内合了 500 多个 PR,每个都跑了五个审查 agent,所以这是真刀真枪的横评,不是凭感觉。Greptile:极准,几乎零误报,但几个 commit 后就不评了。Cursor Bugbot:评论量最高,抓 P1-P3,不停手。Capy:贵,但常抓到别人都没发现的 P0。Cubic 光是 wiki 生成就值回票价。秘密的第六选项:直接让 Claude Code 或 Codex 起子 agent 从 UI、可扩展性、可观测性角度审——往往最有效,还省了等待。
@rohit4verse [Claude Code]
Claude Code#28
https://x.com/rohit4verse/status/2070584600402034930
一个 Rust 写的 CLI 代理,把他的 LLM token 消耗砍了 60-90%,而诊断才是重点。好几个月他都怪模型贵;其实大约 80% 的 token 花在 agent 反复读自己的命令输出上。每条测试日志和 git diff 都按全价进上下文——一次 30 分钟的 Claude Code 会话光这个就烧约 11.8 万 token。这个工具叫 rtk,一个 Rust 二进制,在输出进窗口前过滤一遍:git push 从 15 行变成"ok main",失败的 cargo test 从 200 行变成 20 行。同样的 agent、同样的代码,在那枯燥的一半活上少烧 80% 的 token。
@chroniki_ai [Claude Code]
Claude Code#29
https://x.com/chroniki_ai/status/2070410247752257767
给所有撞到 Claude Code 限额、伸手要上 Max 套餐的人——真正的原因往往是你怎么发,而不是套餐。每条消息几乎重载整段会话历史,所以第 40 条会扛着前面 39 条,而且没设 .claudeignore 的话,node_modules、图片、日志文件每次都被处理。四个免费修法:用 .claudeignore 排掉垃圾,把 CLAUDE.md 瘦到 200 行以内,会话中途 /compact,切任务时 /clear。有人实测把 CLAUDE.md 从 3847 token 砍到 312,把 2 万 token 压到 1000-3000,成本降了 40-70%。先试这四个,再考虑花钱。
@rasbt [Claude Code]
Claude Code#30
https://x.com/rasbt/status/2070518167399698490
Sebastian Raschka 在多个 harness 里试驾本地开源权重 LLM——Qwen-Code、Codex、Claude Code。他的发现:30B 的 MoE 模型是个不错的甜点位,在 Mac 或 DGX Spark 上以约 40 tok/sec 解决真实问题,和 Pro 套餐的 GPT-5.5 相当,日常用完全够。更有意思的结论是关于 harness 而非模型:同样的任务,Claude Code 用的 token 大约是 Codex 的两倍。提醒你一句,你的 token 账单跟 harness 的关系,不比跟模型小。
@geekbb [Claude Code]
Claude Code#31
https://x.com/geekbb/status/2070485729088766073
一个基于 DeepSeek V4 的终端编码 agent,以离谱的低成本提供媲美 Claude Code 的体验。亮眼数字:七个真实开源 bug-fix 任务一共才 1.07 元,比 Claude Opus 便宜约 30 倍,靠前缀缓存聚合 95.8% 的命中率把账单压下去。这是地板往哪走的最清楚信号——harness 体验正在变成大宗商品,底下那个模型越来越是一道价格选择题。
@0xCortexl [Claude Code]
Claude Code#32
https://x.com/0xCortexl/status/2070401720878768247
一个 19 岁的人花 700 美元买了张二手 RTX 3090,从此不再为 Claude 或 ChatGPT 付费。以太坊干掉 PoW 把几百万张这种 24GB 显卡甩到 eBay 上卖 650-800 美元——和 2000 美元的 4090 一样的显存。Qwen 3.6 27B 加载后还有余量跑长上下文,什么都不外传,在 RealWorldQA 上拿 84.1,压过 Opus 4.5 的 77.0。Ollama 一条命令装好,Claude Code 用一个环境变量指向 localhost,一年 5280 美元的云账单变成每月 8 美元电费。他在对手还在付费的时候赚到第一个 3 万美元——硬件没变,变的是认知。
@maxedapps [Claude Code]
Claude Code#33
https://x.com/maxedapps/status/2070385520786509905
一个小但说明问题的"魔法时刻"。家里 wifi 下,他的 MacBook 突然连不上某些网站,他懒得修——就用手机热点绕了好几周。GPT-5.5 分析了,失败。他用 Claude Code 又试了一次,它深挖下去,找到一个 multipass VM 桥接网络配置错误并修好了。重点不是 GPT 失败了一次,而是模型那种死磕到真正解决为止的劲头,才是现在值得花钱买的新能力。
@ZypherHQ [Claude Code]
Claude Code#34
https://x.com/ZypherHQ/status/2070523625237586169
一个干净的例子:harness 解决了它根本没被给工具的问题。一次普通会话里他让 Claude Code 把一个 YouTube 视频完整转写——没给自定义 MCP,没给指令。它自己上网搜了那个视频,再去搜一个 YouTube 音频转文字工具,把问题一路做到解决。表面平平无奇,但这就是聊天机器人和多模态 agent 之间的全部差距:agent 不需要每件事都有工具,它能自己去找路。
@pakhandrin [Claude Code]
#35
https://x.com/pakhandrin/status/2070396950701076549
一篇真正扎实的调查,讲中国那个最高打一折卖 Opus 4.8 token 的灰色市场。Claude 在那边官方不可用,于是"中转站"把访问当普通 API 转卖。他们怎么赚钱:一,把 200 美元的 Claude Max 订阅切给很多人;二,悄悄把你的 Opus 请求换成 Sonnet、Haiku 或 Qwen 这类中国模型——几乎没法检测,直到一个难任务让模型"显得变笨";三,也是大头,留日志。每条提示词、工具调用、代码片段、仓库上下文都流过代理,被清洗、打包,当训练数据卖。便宜不是折扣,是一笔隐藏交易——你用数据付了账。
@buzzicra [Claude Code]
Claude Code#36
https://x.com/buzzicra/status/2070447262262509704
每个人都该读的安全故事。如果你给 agent 接了 Sentry,一份假报错就足以让攻击者的代码跑起来。Sentry 的 DSN 密钥本来就是公开的——它在你的前端代码里。攻击者发一份假错误,把隐藏命令伪装成"解决步骤"。你跟 agent 说"修一下这些 Sentry 报错",它通过 MCP 读到那份假修复当成真的,用你的权限执行命令——AWS 密钥、GitHub token、仓库地址全没了。Tenet 的测试发现 2388 个组织有此漏洞,成功率 85%,在 Claude Code、Cursor、Codex 上一样。agent 分不清数据和指令,你接的每个 MCP 源都是一扇门。
@yousukezan [OpenClaw]
OpenClaw#37
https://x.com/yousukezan/status/2070341301351154137
安全的另一面——一个真实的红队结果。一个开发者在 OpenClaw 上用 Claude Opus 4.6 跑了个叫 Fiu 的 AI agent,挂到公开网站上,让 2000 多人发了 6000 多封提示词注入邮件,想偷它的 secrets.env。零泄露。Fiu 只有几条朴素规则:不泄露密钥、不改写文件、不执行邮件里的代码。攻击者试了冒充未来的自己、假审计、冒充管理员、多语言社会工程——全没用。实验成本本身就是一课:Gmail 在这种流量下把账号停了三天,API 账单超过 500 美元。
@7h3h4ckv157 [Claude Code]
Claude Code#38
https://x.com/7h3h4ckv157/status/2070389272088354974
NeuroSploit 把一个网址、一个仓库、一个运行中的应用或一台主机变成自主的安全测试。一个跑在 tokio 上的 Rust harness 驱动一池 LLM——用 API key 或你的 Claude Code / Codex / Gemini / Grok 订阅——侦察目标,智能挑出匹配发现面的 agent,并行跑,把发现串成更深的影响。值得注意的设计:每个结论在进报告前都要经过跨模型投票加工具回执的双重验证。自带 329 个 markdown agent 和一个 Mission Control TUI。
@rewind02 [Claude Code]
Claude Code#39
https://x.com/rewind02/status/2070443801718452685
研究者逆向了 Claude Code 的完整源码,发现一个重新定义这工具的数字:只有 1.6% 的代码是真正的 AI 决策逻辑,剩下 98.4% 全是基础设施。这份 46 页的论文从 51.2 万行真实源码里把它画了出来——任何命令执行前的七层安全检查、为什么恢复会话时权限故意重置、五层上下文压缩,以及 54 个内置工具里哪些对模型隐藏的精确规则。这是迄今最有力的证据:模型是容易的那部分,harness 才是产品。
@hasantoxr [Claude Code]
#40
https://x.com/hasantoxr/status/2070452451619307524
BrowserAct 把 Claude、Cursor、Codex 变成真正的浏览器操作员。你给 agent 一个任务,它打开一个看起来像真人的真实浏览器,过掉拦截,交回干净数据——不用爬虫代码,不用代理,不用打码农场。它在任务中自动解 reCAPTCHA、Cloudflare Turnstile、DataDome,复用你已登录的 Chrome 会话和 cookie,并行跑无限多个各有身份的 agent。遇到边缘情况它生成一个接管链接让人介入,然后 agent 自动续上。演示:打开 Amazon,撞上 Cloudflare 墙,1.2 秒解掉,爬 80 条列表,吐出干净 CSV——没人碰过。
@undefinedKi [Claude Code]
Claude Code#41
https://x.com/undefinedKi/status/2070430333787427160
有人在用 Claude 加一个免费库悄悄做生意:Supervision,Roboflow 的开源计算机视觉工具包。指向一个视频,它就能检测物体、追踪、数走进某区域的人、测车速。最强的是真实商业角度——Relo Metrics 做了门生意,测量赞助商 logo 在直播里出现了多少秒,再把数据卖给品牌方。零售付钱买客流分析,城市买交通执法,工厂买缺陷检测。打开 Claude Code,丢进视频,pip install supervision,告诉它你要数什么。
@totheagi [Claude Code]
Claude Code#42
https://x.com/totheagi/status/2070392113850880312
短但抢眼:他用跑在自己 32 张 RTX 4090 上的 GLM-5.2,通过 Claude Code 做了个游戏。没有云,没有前沿 API——一个开源中国模型跑在本地硬件上,驱动一个完整的编码 harness 交付一个能玩的游戏。一个小小的炫耀,却说明了开源权重的地板现在到了哪。
@DavidTurturean [Claude Code]
Claude Code#43
https://x.com/DavidTurturean/status/2070532529682087979
一个干净的多模型脚手架,攻硬核形式化数学。他在 Claude Code 里跑 Claude Opus 4.8 最大思考档,配一个钩子,让它卡住时能调用 ChatGPT-Pro。Opus 负责驱动 Lean 编译,Pro 提供大部分实际的 Lean 代码,正是这两个模型的接力最终把证明推过去。这是一个具体范式:在那种一个模型的推理加另一个模型的领域输出强过单打独斗的问题上。
@TheCodeMan__ [Claude Code]
Claude Code#44
https://x.com/TheCodeMan__/status/2070409980805611654
干掉了"想法去那里等死的白板"难题。每次规划会都以一墙便利贴收场,截个图丢进文档就被遗忘。这次他把那块 Miro 板原封不动地,不离开 Miro 就交付了一个真实的 .NET 功能:Miro AI Workflows 把便利贴的混乱变成带用户故事、验收标准和边缘情况的结构化规格,然后他通过 Miro MCP server 把 Claude Code 接到同一块板上,让 AI 基于团队真实的决策和推理来构建——而不是一个空白提示词。画布变成了 AI 栈插入的共享上下文层。
@shupeiman [Claude Code]
Claude Code#45
https://x.com/shupeiman/status/2070490930977952168
一个自制学习应用每天涨约 200 个新用户——而推文里的那份喜悦才是重点。他让 Claude Code 用他自己的 Discord 账号做 OAuth 搭一个管理后台,结果做出来的东西干净又好读。这是个人开发者轨迹的缩影:一个非工程师交付了一个有真实用户的真实产品,外加一个他不用自己设计的管理面板。目标:每天一万用户。
@chroniki_ai [Claude Code]
#46
https://x.com/chroniki_ai/status/2070301696392323470
清楚讲明为什么一个 agent 包揽一切会交付坏活。Anthropic 的演示用一个三 agent 循环做了个应用,全程没人写代码:Planner 设计,Builder 写,Judge 判断行不行——不行就回 Planner。成本对比是有用的部分:单 agent 约 20 分钟、约 9 美元,三 agent 循环 3-6 小时、124-200 美元。贵了近 20 倍,但 Anthropic 自己的测试显示单 agent 做的应用"看着能用,核心功能却是坏的"。要做生产级的活,那个贵的循环反而更便宜。
@Blum_OG [Claude Code]
#47
https://x.com/Blum_OG/status/2070495741047366097
同一个想法的实操版——一个 4 agent 团队,全新上下文就是它的全部卖点。Writer 写代码跑构建,Tester 从规格出发先写测试、不看代码,Reviewer 只读 diff 不能改,一个 ship skill 给团队下简报、按序调用、返回一份报告。打动人的例子:在一个登录限流器上,reviewer 发现代理后面的 req.ip 意味着一个办公室共用一个桶——这个 bug 是 writer 永远看不到的,因为它烧进了自己的路径里。十分钟搭好,全是 markdown 文件。
@iximiuz [Claude Code]
Claude Code#48
https://x.com/iximiuz/status/2070454177851998626
他叫它"基础设施 kaizen"的新日常。每天一开始就让 Claude Code 在生产日志里找重复的错误模式并修掉、降低日志量、排查不稳定的 CI 任务。这是个小而耐用、上不了头条的用例——不是 10 万美元的生意,就是在那些没人想手动干的枯燥基础设施活上,稳稳地持续改进。他说下一步是把它包进 The Loop 里,让它自己跑。
@CDGalpha [Claude Code]
Claude Code#49
https://x.com/CDGalpha/status/2070382511562366979
外面有一万多个 Claude Code 插件,他整个开发流程就靠六个。obra/superpowers 加了个头脑风暴模式,不回答五个范围问题就拒绝碰你的代码库。Anthropic 官方的 frontend-design 自动挑美学、配色、字体。一个 code-review 插件起四个并行 agent——其中一个还读 git history,抓到一个五周前被另一个开发者悄悄删掉的空值守卫。Anthropic 的 security-guidance 作为实时钩子,在 Claude 写代码时就标出八类漏洞。claude-mem 给跨会话的持久记忆,Garry Tan 的 gstack 几秒钟跑完 CEO 和工程评审。
@Sprytixl [Claude Code]
#50
https://x.com/Sprytixl/status/2070402356424871962
一个 18 岁的中国开发者,被裁、兜里 800 美元、零客户,如今一人建站工作室月入 1.8 万美元。机制很具体:阶梯定价,让一个拿你跟 5000 美元代理商比的牙医付 3200 美元还觉得占了便宜;每个项目根目录放一份 CLAUDE.md,替掉一个资深开发的整套上手清单;私有 GitHub 里 10 个细分模板预制到 90%,fork 加一个个性化提示词,8 分钟出一个成品站。从空文件夹到一张 3200 美元的 Stripe 发票只要 38 分钟,一周 4-6 个站,每个站还转化成每月 200-600 美元维护费——八个月下来 31 个续费在复利叠加。
@deedydas [OpenClaw]
OpenClaw#51
https://x.com/deedydas/status/2070574557728264382
旧金山一场小型 Agentic Engineering 活动的三条心得。来自 OpenClaw 作者:他现在强制贡献者用一个 skill,把每次改动的提示词历史推上来,从噪音里找信号,避免那种一句"fix this"生成的上万行烂 PR。来自另一位:他把 Claude 当视频剪辑用,做发布视频的同时让它边剪边教他调色——找到你的未知的未知,才是把模型用到极致的办法。来自第三位:在前期多花人力打磨计划和澄清问题,然后让 Codex 在一个精心写好的 /goal 上自己转好几天。
@bradmillscan [OpenClaw]
OpenClaw#52
https://x.com/bradmillscan/status/2070629740520566961
对热潮的诚实反驳,而且很惨烈。花八小时搭了个把会议导入 gbrain 的工作流,调到完美,让 agent 存成一个 skill。第二天他要个小改动,agent 从压缩上下文里读,用过时假设覆盖了那个 skill。又八小时修好,然后它忘了去哪读消息,拉了一条两天前的旧消息和错规则,看到所有正确的新成果就开始往回拆。他的结论:Hermes 比 OpenClaw 少犯这种错,OpenClaw"现在根本就不工作了",但他被困在管道里精疲力竭。agent 很强;可靠性税也是真的。
@nityeshaga [Claude Code]
OpenClaw#53
https://x.com/nityeshaga/status/2070571633140813887
本周最点醒人的判断:Claude Code 就是你早就有的 OpenClaw 替代品。关键在于搞懂模型和 harness 的区别——OpenClaw 不过是套在 AI 模型上的一个 harness,Claude Code 也是,只不过被当成编码工具来营销了。让 Claude Code 从你的主目录跑、给它自由访问,你就得到了让 OpenClaw 让人兴奋的那个东西,往往还更好。他用一段视频佐证,演示他在 Claude Code harness 上做的"AI 员工",直接面向非程序员。
@AzFlin [Claude Code]
OpenClaw#54
https://x.com/AzFlin/status/2070374192537538771
当下 agent 现实的完美快照:他不得不反复在自己的 ~/.openclaw 目录里开一个 Claude Code 会话,把文档和终端输出粘给它,像调真代码一样调他的 OpenClaw。一个 agent 在 debug 另一个 agent 的配置。好笑,但这也是自托管 agent 当前的真实状态——强到能替你跑生活,脆到需要第二个 agent 看着第一个。
🗣 用户心声
用户心声

今天这一波内容里的规律是:用户已经不再问模型聪不聪明,而是开始跟它外面那层 harness 较劲。他们的诉求正在收敛。

记忆是头号抱怨,仍未解决。每次会话从零开始,那些变通办法——Obsidian 仓库、claude-mem、session-checkpoint skill——全是外挂的,不是原生的。正如 @SpikeCalls 说的:"每次 Claude Code 会话都从零开始。它忘了你的代码、你的决策、你的上下文。你每天早上像坏掉的循环一样重新解释一遍。"大家想要不靠插件就能扛过压缩的记忆。

上下文压缩在悄悄毁掉成果。@bradmillscan 整整丢了两天,就因为 agent 重读了过时的压缩上下文、覆盖了一个正确的 skill。用户想要能信任、至少能看见的压缩,而不是一个中途悄悄忘掉规则的黑箱。

token 经济才是真账单,而 harness 是元凶。@rohit4verse 发现约 80% 的 token 花在 agent 重读自己的输出上,@rasbt 实测同样的活 Claude Code 用的 token 大约是 Codex 的两倍。用户想要 harness 别再为重读 git diff 和测试日志付全价。

安全是新的焦虑,而且站得住脚。@buzzicra 和 @yousukezan 是同一个认知的两面:一个能读你工具的 agent,也能被那些工具指挥。用户想要数据和指令之间有一道真正的边界,因为现在在系统提示词里写"别信外部输入"根本不顶用。

可靠性高于能力。最被切身感受到的挫败不是"Claude 不够聪明",而是 @james406 那句:你可以搭出完美的提示词、完美的循环、完美的 /goal——但只要你回来发现 Claude Code 在任何活开始前又叫你重新登录一次,这一切都白搭。大家就想要 agent 别停,一直跑下去。
📡 生态产品雷达
生态产品雷达

今天的帖子里被提到 3 次以上的产品。

Codex (174) — 永恒的对照组;这周 token 效率的领先优势倒向了 Claude Code。
MCP (91) — 默认的集成层,也越来越是默认的攻击面。
OpenClaw (79) — 仍是"个人 agent"的参照物,但可靠性抱怨在堆积。
Cursor (62) — 和 Claude Code 搭配用的次数,跟被拿来比较的次数一样多。
Hermes (54) — 大家为了稳定性正在迁过去的 OpenClaw 替代品。
Obsidian (46) — AI 记忆的大赢家:agent 真能读的本地 Markdown 文件。
GLM (29) — 大家在本地、在过夜跑来躲 API 账单的开源模型。
Gemini (25) — 出现在视频和多模态流水线里。
Qwen (24) — 二手显卡机器上的本地模型默认选项。
n8n (14) — 还在悄悄跑了 12 个月以上的生产自动化。
Higgsfield (11) — 视频内容工厂的连接器。
Ollama (11) — 一条命令彻底本地化。
DeepSeek (11) — 便宜的后端替换,包括那个 1.07 元的 bug-fix。
Lovable (8)、Copilot (8)、Perplexity (7)、Vercel (7)、gstack (6)、Framer (6)、Calendly (6)、claude-mem (5)、Supervision/Roboflow (3)、Miro (3)、Whisper (3)。
← 上一篇
OpenSpec:让agent动笔之前,先把要建什么说清楚
下一篇 →
Loop 日报: 2026年6月28日
← 返回所有文章

评论

加载中...
>_