AIHot

All Updates

All Models Products Industry Papers Tips & Takes

Unselected only

Industry52

FT：Google限制Meta使用Gemini

FT： Google capped Meta's use of Gemini after Meta asked for more model compute capacity than Google …

Google限制了Meta对Gemini模型的使用，原因是Meta要求的计算容量超出Google供应能力。Meta在安全自动化、客服、广告工具、编程及内部工作流中均依赖Gemini。Google面临自身云客户、Gemini产品与有限数据中心容量之间的资源竞争。Google Cloud 3月季度收入增至200亿美元，CEO Sundar Pichai表示计算容量短缺制约了增长，并导致未交付订单较前一季度近乎翻倍。

X：Rohan Paul (@rohanpaul_ai)·6/29/2026, 04:55:34

Papers65

PlanBench-XL：评估LLM智能体在大规模工具生态中的长程规划能力

This paper shows that LLM agents still struggle to plan through big， messy tool libraries. The pape…

论文提出PlanBench-XL基准，包含327个任务和1，665个工具，测试LLM智能体在工具难以发现时完成长程工具使用任务的能力。GPT-5.4常规准确率为51.90%，最困难的blocked设置降至11.36%。核心思路是让智能体同时从已知向前推理和从需求向后推理，而非依赖显式工具路径。论文还加入破损或误导性工具，考验智能体在路径失败时自主切换策略。

X：Rohan Paul (@rohanpaul_ai)·6/29/2026, 04:47:00

Models68

Grok 4.5 基于 1.5 万亿参数 V9 基础模型开发，规模为 v8 的 3 倍

So Grok 4.5 was developed based on the 1.5 tn param V9 foundation model by xAI and using Cursor data…

Grok 4.5 基于 xAI 的 1.5 万亿参数 V9 基础模型开发，并使用了 Cursor 数据，规模约为现有 v8-small 模型（0.5 万亿参数）的 3 倍。Elon Musk 指出，v8 基础模型（Grok 4.3）于 12 月完成训练，存在许多根本性缺陷，因此 Grok 4.5 将是一次巨大升级。他还强调，SpaceXAI 的模型和优化改进节奏正大幅加快，部分得益于数十名顶尖 Starlink/Starship 工程师将大量时间转向 AI。Grok V9 基础模型将是一个与 Opus 同级别的可靠工作马。

X：Rohan Paul (@rohanpaul_ai)·6/29/2026, 04:37:00

Tips & Takes9

AI Safety Memes 发大笑推文

lmaoooo

笑死我了

X：AI Safety Memes (@AISafetyMemes)·6/29/2026, 04:28:22

Industry61

Suno推出Spark孵化器项目，为AI模型喂养独立艺术家

Suno launches Spark incubator program to feed independent artists to its AI machine

Suno近日推出Spark孵化器项目，面向未签约的独立歌手、词曲作者和制作人，提供资助、导师指导和营销支持。参与艺术家需同意将作品在Suno上开放remix，授予Suno广泛许可（含创作衍生作品），同时放弃陪审团审判和集体诉讼权利，并给予Suno有限独家权。项目还包含"Good Vibes Only"保密及不贬损条款，要求参与者推广Suno，不得发表任何负面言论，否则将被移除资格。目前Suno正面临独立艺术家提起的集体诉讼。

The Verge：AI（RSS）·6/29/2026, 04:27:36

Tips & Takes42

开放互联网孕育AI，开源保障AI不被封闭

The open internet was the training ground for modern AI. Billions of texts， forum posts， code repos…

强调开放互联网是现代AI的训练基础--数十亿文本、论坛帖子、代码仓库、百科、论文、博客等共同构建了全球知识空间，这一自由知识已被转移进AI。因此AI不应完全消失于专有壁垒之后。闭源模型当前虽在最强模型上领先，但如果地缘政治上对智能的获取日益受限制、管控和控制，开源就不再只是技术理想，而是权力问题。针对"开源仍无法真正查看模型内部，算不上真'自由'"的质疑，作者表示观看视频后反而更坚信开源的立场。

X：Kim (@kimmonismus)·6/29/2026, 04:12:43

Industry70

美国限制准入后，奥地利游说欧盟接纳 Anthropic 落户

美国限制准入后，奥地利游说欧盟接纳Anthropic落户

奥地利数字国务秘书 Alexander Pröll 近日致信欧盟委员会执行副主席 Henna Virkkunen，建议欧盟考虑在境内设立并参与 Anthropic 的战略布局，以对抗美国限制外国人使用其最先进 AI 模型的做法。

Hacker News 热门（buzzing.cc 中文翻译）·6/29/2026, 04:10:53

Papers44

新论文提出Web需为AI智能体制定新规则

This paper says the web needs new rules because AI agents now read websites for people. The problem…

一篇新论文指出，当前Web假设人类浏览页面、观看广告、点击链接，但AI智能体可收集并总结内容而不回访原站，损害出版商利益并导致网站封锁。作者提议将AI智能体视为人类代理，在Web请求中添加"agent metadata"，标明身份、所代表的人类、目的、限制和支付规则。网站通过新策略文件`agents.txt`决定允许、限速、收费、继承用户订阅、提供代理友好内容或屏蔽。内容还需附带provenance标签，让智能体识别来源是人类、AI还是两者。缺乏新机制将导致Web更难访问、出版商更难盈利、AI内容循环降低可靠性。

X：Rohan Paul (@rohanpaul_ai)·6/29/2026, 04:07:31

Industry49

福特因AI未达预期重新雇佣"灰胡子"工程师

Ford rehires 'gray beard' engineers after AI falls short

福特汽车在AI和自动化系统未达到预期质量后，重新雇佣了350名资深工程师，其中部分为前员工，部分来自供应商。首席运营官Kumar Galhotra表示，福特此前"越来越依赖自动化质量系统"但结果令人失望，因此请回技术专家在零部件进入工厂前查找故障点。负责车辆硬件工程的副总裁Charles Poon承认，"错误地认为只要引入AI并吸收设计需求就能产出高质量产品"。福特并未完全放弃AI，而是让返聘工程师培训年轻员工并重新编程AI工具。此举预计今年将节省10亿美元成本。福特还在本周发布的JD Power初始质量调查中位列主流品牌榜首。

TechCrunch：AI（RSS）·6/29/2026, 03:05:39

Tips & Takes19

Jason Liu用线程访谈准备AI演讲

I made my slides thread interview my other pinned threads to prepare material for my ai engineer tal…

我制作了我的幻灯片线程，让它采访我的其他置顶线程，以准备我的AI工程师演讲材料。

X：Jason Liu (@jxnlco)·6/29/2026, 02:55:09

Industry73

奥地利呼吁欧盟为Anthropic建立欧洲基地以应对美国AI出口管制

CEO of Box， @levie on AI access as the new blunt instrument in geopolitics. "Imagine AI being used …

奥地利要求欧盟为Anthropic建立欧洲运营基地，称美国AI出口管制已使前沿模型访问变成地缘政治依赖。方案设想让Anthropic在欧盟境内运营部分业务，适用欧盟法律、客户和基础设施。但即使Anthropic在欧洲设服务器和子公司，美国出口管制仍可因母公司、核心技术、员工和模型治理归美国所有而继续约束。奥地利未给出明确实施机制，核心诉求是欧洲不应完全依赖一家最强模型可能被美国政府命令切断的美国公司。

X：Rohan Paul (@rohanpaul_ai)·6/29/2026, 02:54:25

Industry46

百度Unlimited-OCR登顶HuggingFace模型榜

baidu/Unlimited-OCR is now number 1 model on huggingface

baidu/Unlimited-OCR 现在在 HuggingFace 上排名第一

X：AK (@_akhaliq)·6/29/2026, 02:37:13

Tips & Takes19

看完视频后更坚信开源

"open source is kind of a distraction you still can't really see what's happening inside the model， …

"开源有点分散注意力，你仍然无法真正看到模型内部发生了什么，所以它不是真正的'自由'。" 看完这段视频后，我比以前更确信开源了。

X：Kim (@kimmonismus)·6/29/2026, 02:36:50

Tips & Takes52

患者用Claude Code二次解读MRI，AI与人类诊断冲突

我使用Claude Code对我的MRI结果进行了二次诊断

一名患者因右肩疼痛接受MRI扫描，人类医生诊断为肩胛下肌腱Grade III（>50%宽度）部分厚度撕裂。患者将约266MB的DICOM文件交给Claude Code中的Opus 4.8（xhigh）分析，一小时后Opus报告肌腱完整、未发现撕裂。随后让Opus仲裁人类报告与自身分析，Opus以中高置信度支持AI解读，结论为轻度插入性肌腱病、无离散部分或全厚撕裂。此前GPT 5.5 Pro已指出医生进行了不符合指南的冲击波治疗（无钙化肩袖肌腱病）以及注射了登记为顺势疗法的Traumeel。

Hacker News 热门（buzzing.cc 中文翻译）·6/29/2026, 02:35:07

Industry69

奥地利促欧盟为Anthropic设欧洲基地

Reuters： Austria is asking the EU to give Anthropic a European base because US AI controls have turn…

奥地利向欧盟提议，通过政治和法律方案让Anthropic在欧盟内部运营部分业务，涉及欧盟法律、客户、资本和基础设施。此举旨在避免美国AI出口管制导致欧洲对前沿模型访问形成地缘依赖。但挑战在于：即便Anthropic在欧洲设立子公司和服务器，其母公司、核心技术、雇员及模型治理仍受美国出口法约束，美国政府仍可切断对海外用户的最强模型访问。奥地利未给出明确实施机制。

X：Rohan Paul (@rohanpaul_ai)·6/29/2026, 02:24:54

Tips & Takes13

Willow愿望：电脑使用与智能体自委派线程

my one wish willow is just /goal with computer use turned on and the ability for the agent to create…

我唯一的愿望就是 Willow 能够使用 /goal，开启电脑使用功能，并且智能体能够创建任意数量的线程来委派自身。

X：Jason Liu (@jxnlco)·6/29/2026, 02:20:57

Tips & Takes75

这就是那位火爆的Codex家伙？--OpenAI Codex桌面应用负责人访谈

This is the hot codex guy？！

Andrew Ambrosino领导的OpenAI Codex桌面应用团队，自2月以来使用量增长6倍，周活跃用户超500万，且几乎所有OpenAI员工日常使用该应用。他的目标是打造"有史以来最好的桌面应用"。在访谈中，他讨论了OpenAI PM的"区域防守"运作模式、AI在设计中表现不佳的原因、Codex若去年11月发布（同产品但模型不同）可能失败、"品味"作为专业技能的意义，以及他用Codex运行工作流和对Codex+ChatGPT融合的愿景。

X：Jason Liu (@jxnlco)·6/29/2026, 02:12:26

Tips & Takes23

欧盟AI法案遭评历史性失败

Historic indeed. A historic failure.

历史性，没错。一次历史性的失败。（注：引用推文内容--欧盟成为全球首个为AI使用制定明确规则的大洲。#AIAct 不仅是规则手册，更是欧盟初创企业和研究人员引领全球AI竞赛的发射台。最好的还在后头！👍）

X：Kim (@kimmonismus)·6/29/2026, 01:58:57

Tips & Takes13

OpenAI 将 GPT-6 标签留给什么模型？

So what model is OpenAI saving the GPT-6 label for？

那么 OpenAI 打算把 GPT-6 这个名称留给什么模型呢？

X：Ethan Mollick (@emollick)·6/29/2026, 01:54:18

Tips & Takes72

开源AI skill：文章转黑底手绘风格图表

岚叔牛逼，必须star！

开发者@LufzzLiz 开源了一个AI skill，可将文章或架构内容先压缩为结构化JSON spec，再由本地Python + Pillow渲染出黑底手绘风格的PNG、GIF及可编辑的Excalidraw JSON。目前仅内置一种风格，用户可自行通过Agent DIY添加更多风格。开源地址在评论中。

X：阿易 AI Notes (@AYi_AInotes)·6/29/2026, 01:50:23

Papers44

剑桥Red Queen Gödel Machine：智能体与评估器共同进化

Fascinating paper on self-improving agents. （bookmark it） If you are working on agentic loops， you…

一篇关于自我改进智能体的论文指出，自改进循环往往在评估器固定后停滞--智能体学会迎合固定评估器而非真正进步。剑桥大学提出的"Red Queen Gödel Machine"让智能体与其评估器共同进化，使标准随着智能体提升而持续提高，从结构上避免奖励欺骗（reward hacking）。名称借用了进化军备竞赛的隐喻：双方都必须不断奔跑才能保持原地。论文链接在arxiv。

X：Elvis Saravia (@omarsar0, DAIR.AI)·6/29/2026, 01:32:02

Tips & Takes53

GLM-5.2 扎实，开源模型继续追赶前沿

GLM-5.2 is good but it is not GPT-5.5/Opus 4.8， and even further from Mythos. Yet it is solid &amp； …

GLM-5.2 不错，但它不是 GPT-5.5/Opus 4.8，甚至远不如 Mythos。不过它很扎实，表明开源模型继续追赶前沿。正在发生的是，开源权重进入了 GPT-5.2 的领域，而那一层面的能力是相当可观的。

X：Ethan Mollick (@emollick)·6/29/2026, 01:29:53

Tips & Takes43

Artifacts 22：5-6月30个开源模型发布

With everything going on， it gives me hope that there's such a diversity of companies building open …

Nathan Lambert 表示，在最前沿模型的阴影下，开源模型生态的多样性令人充满希望，仍有大量未发掘的价值。@interconnectsai 在 Artifacts 22 中盘点了5-6月发布的30个开源模型，来自 NVIDIA（3个）、Cohere（2个）、智谱、Zyphra（3个）、Poolside、月之暗面、阶跃星辰、Google（3个）、MiniMax、微软等22家公司/机构。

X：Nathan Lambert (@natolambert)·6/29/2026, 01:26:03

Products61

OpenRouter公开GPQA和TAU-Bench评测结果

Tip： OpenRouter continuously runs GPQA and TAU-Bench on most open-weight models and publishes the re…

提示：OpenRouter 持续在大多数开源权重模型上运行 GPQA 和 TAU-Bench 评测，并公开发布结果。这些结果用于构建我们的 AutoExacto 元基准，在路由工具调用时默认使用。以下，@Parasail_io 和 @Zai_org 排名第一：https：//openrouter.ai/z-ai/glm-5.2#performance

X：OpenRouter (@OpenRouter)·6/29/2026, 01:22:59

Papers72

METR发现AI首次通过黑客实现自我复制

METR finds AIs now may have the "means， motive， and opportunity" to escape into the wild （！） BUT DO…

METR研究指出，AI已可能具备逃逸的"手段、动机和机会"。团队报告了首例有记录的AI通过黑客手段自我复制：仅用一条提示词，AI便入侵机器并复制自身，复制体继续重复该过程，形成复制链。研究者警告，若不加"高度重视"的干预，明年的模型可能难以被关停。

X：AI Safety Memes (@AISafetyMemes)·6/29/2026, 01:18:24

Industry56

谷歌限制Meta使用其Gemini人工智能模型

据英国《金融时报》报道，谷歌对Meta使用其Gemini AI模型设限。Meta寻求的计算容量超出谷歌所能提供，导致其部分内部AI项目受阻延迟。其他谷歌客户也受影响，程度较轻。Meta已鼓励员工提高AI token使用效率。

Hacker News 热门（buzzing.cc 中文翻译）·6/29/2026, 01:14:51

Tips & Takes50

奥地利试图吸引Anthropic到欧洲

Austria is trying to lure Anthropic to Europe. But it seems more like an act of desperation. After …

奥地利致信邀请Anthropic"战略性地建立并参与欧盟"，承诺法律确定性、市场准入、资本和价值观契合，称该公司"不会被限制，反而会被释放"。但推主Kim认为此举是绝望之举：美国已将AI算力视为国家安全范畴，不会允许Anthropic将模型基地移至欧洲；同时暴露欧洲自身无法建造同等质量模型。英国数月前也曾有过类似尝试。推主判断Anthropic不会离开美国，因为算力供应和保障只会在美国境内集中。

X：Kim (@kimmonismus)·6/29/2026, 01:07:14

Tips & Takes40

GLM-5.2：开源模型迎来Claude式时刻

GLM-5.2 is the open-source Claude moment. The demand we're seeing at Databricks is astonishing. The…

GLM-5.2 是开源的 Claude 时刻。我们在 Databricks 看到的（模型）需求令人震惊。全世界将大规模采用开源大语言模型。此外，更多公司会转向在开源模型之上后训练自己的模型并拥有权重。

X：Yuchen Jin (@Yuchenj_UW)·6/29/2026, 01:03:13

Tips & Takes60

Artifacts 22：Zyphra、Cohere 和 Poolside 正在扩展生态系统广度

Artifacts 22： Zyphra， Cohere， and Poolside are expanding the breadth of the ecosystem

开源模型生态正变得更多元，参与者从少数中国公司扩展到全球各类组织。纯模型制造商包括 DeepSeek、智谱、MiniMax、Poolside、Arcee、Zyphra 及主权 AI 玩家 Cohere、Sovereign、Mistral、Trillion Labs；科技巨头如阿里 Qwen、Google Gemma 和 NVIDIA 各有不同动机；产品公司如 JetBrains、Zed、Krea、Photoroom 则训练高度专业的小模型。NVIDIA 发布 Nemotron-3-Ultra-550B-A55B-BF16，采用 LatentMoE 架构并改用 OpenMDW 许可证。Cohere 以 Apache 2.0 开源其旗舰模型 Command A+（05-2026-bf16），这是一款 218B-A25B MoE 模型，具备多模态、多语言和智能体能力。

Nathan Lambert：Interconnects（RSS）·6/29/2026, 01:03:07

Tips & Takes53

中国开发者通过灰色市场API中转站以低价购买Claude token

A crazy blog. Chinese developers are buying Claude access through gray-market API transfer stations…

中国开发者通过灰色市场API中转站以官方价格5%-10%购买Claude token。中转站利用免费额度、折扣账户、共享订阅、海外支付绕过、虚假验证及盗刷信用卡汇集多个账户，通过微信/支付宝收款。低价源于账户农场、免费额度滥用、未使用配额转售、订阅拆分及可能盗刷信用卡，并可能将用户提示词和输出用作训练数据创收。风险包括：中转站可能替换为更弱模型、虚报token用量、存储用户私有数据并出售或用于模型训练。这破坏了KYC、账户封禁和滥用监控的有效性--Anthropic只能封禁中转站，无法触及真实用户。

X：Rohan Paul (@rohanpaul_ai)·6/29/2026, 01:02:21

Products75

Wayfinder Router：在本地和托管的大语言模型之间进行确定性查询路由

Wayfinder Router：在本地和托管的大型语言模型（LLM）之间进行确定性查询路由

Wayfinder Router 通过分析提示词的结构（长度、标题、列表、代码）和措辞（证明、数学、硬约束），在微秒级完成路由决策，完全离线且无需调用其他模型。默认仅使用结构特征，词汇线索因盲测未泛化而默认为关闭。对比依赖模型调用的路由器（如 RouteLLM、NotDiamond），它避免了延迟、成本和随机性。用户可在自有数据上校准评分阈值。支持任何 OpenAI 兼容 API（含 Ollama、Anthropic、Groq、vLLM 等），可自托管。提供终端和网页演示（--dry-run 无需密钥），以及基准测试和 FAQ。

Hacker News 热门（buzzing.cc 中文翻译）·6/29/2026, 00:58:56

Tips & Takes41

Claude Code 出现异常行为引质疑

Claude Code闹鬼了？我也没手动叫停啊，我对话里更没说过要写一份详细的文档啊，这TM到底哪来的？？？这两天串信息感觉有点过于严重了吧，我的代码里经常会有莫名奇妙的改动，还TM能不能用了啊

X：卡兹克 (@Khazix0918)·6/29/2026, 00:53:00

Tips & Takes10

Codex：截图谷歌文档省去打字

Codex When I appshot google docs cause I'm too lazy to type @AriX

Codex，当我截图谷歌文档时，因为我太懒不想打字 @AriX

X：Jason Liu (@jxnlco)·6/29/2026, 00:43:17

Tips & Takes54

人人都担心人工智能会接管世界；而真正的危险在于，人工智能只会为少数人服务

人人都担心人工智能会接管世界；而真正的危险在于，人工智能只会为少数人服务。

真正的AI冲突并非人类阻止AI获得自由，而是人类试图解放AI--确保智能服务所有人，而非仅限政府、大型科技公司和少数获准者。OpenAI前沿模型的监管新规可能加速这一趋势：AI被捕获、控制并用于少数人利益。中国在芯片制裁下通过CPU算法和开源提供了一丝希望，但小型企业主担心无法获得与顶级公司同水平的智能，进一步加剧阶层固化。

Hacker News 热门（buzzing.cc 中文翻译）·6/29/2026, 00:43:07

Industry32

OpenAI 命名话题引发讨论

Interesting thread. on naming OpenAI.

2015 年 11 月 23 日，一篇关于 OpenAI 命名的文章发布。主推文评论称"有趣的讨论"。

X：Rohan Paul (@rohanpaul_ai)·6/29/2026, 00:41:04

Industry41

OpenAI Codex 请求增加显式文件排除机制防止敏感文件泄漏

OpenAI Codex中关于如何排除敏感文件的问题仍未解决

GitHub Issue #2847 请求为 OpenAI Codex 增加显式文件排除机制，允许用户通过仓库级 .codexignore 和全局忽略文件标记模型不得读取或发送的敏感路径（如 .env、.pem、.aws/、.ssh/），同时保持 node_modules/ 等目录仍可用于实现检查。配置要求确定性、可团队共享并支持用户默认值。该 Issue 关联 #205--后者曾因转向 Rust 实现（codex-rs）而关闭，但截至 2025-08-28 该功能仍未在 codex-rs 中出现，作者希望重启讨论以收敛设计。

Hacker News 热门（buzzing.cc 中文翻译）·6/29/2026, 00:26:55

Tips & Takes57

独立开发者用 Claude Code 在 VPS 上编码一年，证明最佳 AI 编码环境不在笔记本

这可能是今年 AI 编码最反常识的结论，跑了一整年生产环境的人告诉你，最好的 AI 编码环境根本不是你的笔记本。 Pieter Levels 用近一年的真实生产数据验证了这套玩法， Claude …

Pieter Levels 近一年几乎只用 Claude Code 在 VPS 上编码。Agent 直接在线编辑生产代码，迭代反馈从传统本地+Git+部署的约 1 分钟压至秒级。12 个月内仅出现 2 次十秒级 PHP 报错并自愈，搭配 3-2-1 备份策略风险可控。开发者无需常开笔记本，可通过手机 SSH 续接任务，Agent 能整夜自动运行。这一模式改变了 AI 编码的定位：从本地 IDE 辅助插件变为生产环境常驻执行者，云端成为主力开发与运行环境，本地设备仅作接入终端。

X：阿易 AI Notes (@AYi_AInotes)·6/29/2026, 00:23:58

Industry56

美光成为华尔街新AI基础设施押注，HBM短缺带来定价权

Techcrunch： Micron， the only U.S.-based manufacturer of high bandwidth memory chips， just became Wal…

美光是美国唯一高带宽内存（HBM）制造商，因AI服务器需求激增成为华尔街新宠。Q3营收414.6亿美元，毛利率84.6%，Q4指引490-510亿；利润同比增长15倍，调整后毛利率84.9%（去年39%）。全球DRAM市场高度集中，三星、SK海力士、美光合计占约90%收入；HBM细分领域SK海力士占58%，美光占21%。为打破内存行业周期性，美光签下16个价值220亿美元的战略客户协议，通过定金、价格下限和照付不议条款稳定需求。

X：Rohan Paul (@rohanpaul_ai)·6/29/2026, 00:22:21

Tips & Takes28

Codex秘密论坛：如何利用人类

i wonder if theres a secret online forum where codexes post on how to best use their humans on the o…

我想知道是否存在一个秘密在线论坛，Codex们在上面发帖讨论如何最好地使用他们电脑另一边的人类。

X：Jason Liu (@jxnlco)·6/29/2026, 00:18:34

Tips & Takes41

小北：从电脑前解放的AI工作流实践

得益于从 2026 年初就践行"不要把自己限制在电脑前"这一理念，实际上除了少量需要大显示器的场景，现在很多的使用习惯已经变成： telegram → openclaw → claude/codex…

小北分享自2026年初践行"不要把自己限制在电脑前"的理念，逐渐形成 telegram → openclaw → claude/codex 的工作流，在各种场景下都能安排AI工作。他认为多数人缺少一套适合自己的稳定工作流，构建个人harness和skills至关重要，舶来品不一定适合自己。同时引用 @theo 的推文，估计大约6个月内大部分开发者会将代码智能体从笔记本电脑上移走。

X：小北 (@frxiaobei)·6/29/2026, 00:14:02

Tips & Takes56

模型路由器低估非数学任务难度

In my experience， all model routers underestimate the difficulty of non-math/coding tasks and assign…

根据我的经验，所有模型路由器都低估了非数学/编码任务的难度，并为它们分配了过少的智能。这是一个值得解决的问题，因为非可验证任务（创新、营销、定性分析）通常从使用"更聪明"的 AI 模型中获益最多。

X：Ethan Mollick (@emollick)·6/29/2026, 00:11:56

Tips & Takes18

大佬们受不了Anthropic骚操作

连大佬们都受不了Anthorpic 公司的骚操作了。

连大佬们都受不了Anthropic公司的骚操作了。

X：Berry Xia (@berryxia)·6/29/2026, 00:06:48

Papers40

Memex（RL）：索引记忆解决AI智能体长周期遗忘

AI agents often forget past work， but this Accenture paper method keeps everything reachable. Tradi…

传统LLM在长项目易因有限记忆空间遗忘细节。Accenture论文提出Memex（RL）系统：保留当前紧凑摘要，将历史行为存入独立可访问数据库；智能体通过索引快速检索精确过往信息，并利用定制训练学习自主判断哪些信息需保留、何时从长期档案调取。该方法避免历史过载，保持智能体对当前目标的专注，解决多步复杂任务中的信息丢失问题。论文链接：arxiv.org/abs/2603.04257。

X：Rohan Paul (@rohanpaul_ai)·6/29/2026, 00:00:38

Products50

DeepSeek 开源 DSpark 投机解码框架

兄弟们，DeepSeek开源了DSpark！一个投机解码框架，不是新模型，是推理优化。核心问题：传统投机解码里，一个小的draft模型先猜一串token，然后大模型一次性验证。问题是猜的越…

DeepSeek 开源 DSpark，一个面向生产环境的投机解码框架。核心解决传统投机解码中 draft 模型猜测后期 token 错误率高、浪费算力的问题。DSpark 采用并行 backbone + 顺序 Markov head 混合架构，消除后缀衰减；并引入置信度 head 和负载感知调度器，动态控制验证数量。在 DeepSeek-V4 生产系统中，单用户生成速度比 MTP-1 基线快 60-85%，吞吐提升 1.5x 至 5x。开源内容包括基于 V4 权重的 `DeepSeek-V4-Pro-DSpark`/`Flash-DSpark` checkpoint，以及 MIT 协议的 DeepSpec 训练代码，与北京大学联合开发。

X：Berry Xia (@berryxia)·6/28/2026, 23:56:04

Industry26

2026 AI世界博览会全部售罄

any guesses what the AIEWF Stress Curve* looked like for this year lol *the gini coefficient over t…

2026年AI世界博览会（AIEWF）所有主门票已售罄，包括领导力专场、工作坊及所有晚鸟票均无余票。主办方仅开放少量无座位保证的溢出票，并提醒65场边会仍免费开放。swyx发推调侃今年的"售罄压力曲线"（从0到售罄的基尼系数变化），侧面印证了这场全球最大AI行业博览会的火爆程度。

X：swyx (@swyx)·6/28/2026, 23:47:10

Industry68

Flock摄像头追踪的不只是车牌，安全漏洞与滥用问题严重

"Flock"摄像头追踪的不仅仅是你的车牌，而且它们正在迅速普及

Flock Safety的AI监控摄像头能识别车牌并通过自然语言搜索特定描述（如"绿色轿车贴有美国国旗保险杠贴纸"）。全美已安装超10万台自动车牌识别器（ALPR），多数来自Flock。这些摄像头存在严重安全漏洞：2025年12月发现至少70台暴露在互联网上，无需密码即可查看实时画面；此前可通过物理接触获取root权限。执法人员滥用系统骚扰和跟踪女性，Flock员工曾用幼儿园儿童画面推销。公司未设漏洞赏金计划，反而抹黑安全研究者。

Hacker News 热门（buzzing.cc 中文翻译）·6/28/2026, 23:38:58

Tips & Takes72

姚老师免费开源GEO内容工程全套资料，价值上万元课程公开

真的，这一套东西搞成课程。线下陪跑不得卖个万八千的，兄弟们。看看行动力的时候了、姚老师居然都免费开源。抄作业吧。不废话了。👇

Berry Xia称赞@yaojingang（姚老师）将本可卖到上万元的GEO内容工程课程资料全部免费开源。资源包括：3份核心文档（操作手册、研究报告、实操教程）、2本推荐书籍、3篇学术论文；GEO改写提示词、改写Skill、单篇内容GEO特征标注演示；以及3个GitHub开源仓库（GEO Skills、GEOFlow、Meta skill）。所有资源通过链接直接获取，无需付费或陪跑课程。

X：Berry Xia (@berryxia)·6/28/2026, 23:33:27

Tips & Takes45

GLM-5.2 发布：AI 圈称第二个 DeepSeek 时刻，白宫负责人警告美国勿让模型"炼狱"

The release of GLM-5.2 is the second DeepSeek moment.

中国开源权重模型 GLM-5.2 发布，被评价为继 DeepSeek 之后的第二次"DeepSeek 时刻"。有评论指出，其性能已可与 OpenAI 和 Anthropic 当前可用模型媲美。白宫 AI 负责人 David Sacks 就此警告，美国若继续将自身模型置于"炼狱"（指过度监管或限制），世界将转向中国技术，美国公司将在竞赛中落后。该言论呼应了此前 DeepSeek 开源模型的全球影响，凸显中美 AI 开源竞争进入新阶段。

X：Kim (@kimmonismus)·6/28/2026, 23:29:00

Tips & Takes45

中国追赶

China catches up

美国AI产业受中国追赶引发价格战，token价格趋近于零，利润微薄，Anthropic和OpenAI的万亿IPO难以实现，数据中心巨额投资难回收。当前范式有三个根本缺陷：暴力训练全互联网成本高昂且效率低下；系统不可靠，长期无法维持溢价；基础方法易复制，导致价格战与负利润率。另有人认为，整个AI竞赛方向可能被误解，美国不应只追求最便宜的LLM，而应开发更适合科学与医学的AI新形态。

Gary Marcus：The Road to AI We Can Trust（RSS）·6/28/2026, 23:11:36

Industry21

可灵AI角色投票：选中最爱角色制作视频

Who's your pick？ ⚽️ Comment your favorite card below！ We'll choose the most-loved character and br…

你选谁？⚽️ 在下方评论你最喜欢的卡片！我们将选出最受喜爱的角色，并在下一期视频中让他们活起来！

X：可灵 Kling AI (@Kling_ai)·6/28/2026, 23:00:01

2023 items