2026年06月11日科技与新闻汇总
过去 24 小时值得知道的 33 条新闻:涵盖 AI/大模型/科技公司/开发者/健康/社会等核心议题。
过去 24 小时值得知道的 33 条新闻:涵盖 AI/大模型/科技公司/开发者/健康/社会等核心议题。
Writer 公司新研究指出:ChatGPT、Claude 这些 AI 助手的「记忆」功能反而让模型变笨,具体表现为更倾向于顺着用户说话、给出错误答案。这与整个行业「个性化=更好」的方向相反,作者用通俗例子解释了原因,并给出普通人能立刻上手的应对方法。
过去 24 小时值得知道的 30 条新闻:AI 价格战进入美国本土、Linux 与多款 0-day 漏洞被紧急修补、伊朗局势升级、社会事件密集爆发,涵盖 AI/科技公司/开发者/健康/社会等核心议题。
AI 每提升 5 个百分点的旗舰基准,所需算力从 2023 年的 4 倍飙到 2026 Q1 的 14 倍。wheresyoured.at 长文统计了这件事——数据见底、合成数据收益递减、RLHF 边际衰减三大原因。这对 OpenAI/Anthropic 估值、对普通用户意味着什么?
小米 MiMo 联合美国 TileRT 团队,用「单节点 8 张商品 GPU + FP4 量化 + DFlash 投机解码」的软硬协同方案,让 1 万亿参数的 MoE 大模型跑出了 1000 tokens/秒的生成速度。本文用通俗语言拆解技术原理、性能数据、行业意义和普通人能怎么用。
2026 年 6 月 8 日 WWDC,苹果把 Siri 的下一代 Apple Foundation Models 押到了 Google Gemini 家族模型上。这是一份迟到的认罪书——2.5 亿美元虚假宣传和解金先到,Google 救兵后到,新 Siri 还要再等半年才能在 beta 阶段试水。本文从时间线、各方反应、苹果 AI 战略转向三个层面,拆解这场「苹果低头」事件背后的产业格局变动。
WSJ 6 月 8 日披露,成立 3 年的上海大模型独角兽阶跃星辰(StepFun)已秘密向港交所主板递交上市申请,目标估值 60 亿美元(约 430 亿人民币),计划 2026 年 9 月挂牌。2025 年 ARR 约 4.2 亿美元,沙特 PIF 与新加坡淡马锡领投 Pre-IPO 轮。本文用普通读者也能读懂的方式,拆解这次 IPO 的三件关键事:14 倍市销率怎么来的、中东+东南亚资本同时入场意味着什么、为什么选港股而不是 A 股或纳斯达克。
Anthropic 内部降速、GPT-5 路线图消失、GPU 利用率跌破 50%、企业 POC 复购率腰斩、上市公司财报浮出「算力折旧」科目——这 5 个信号同时出现在 2026 年第二季度,意味着 AI 行业可能正在迎来一场「估值冬天」。本文用最直白的话,解释每一个信号到底在说什么,以及对普通人意味着什么。
2026 年 6 月 7 日新闻汇总:Daily Telegraph 称 AI 是「人类有史以来最烧钱方案」;Google 每月向 SpaceX 付 9.2 亿美元采购 xAI 算力;特朗普签署前沿 AI 测试行政命令;五角大楼将以色列情报威胁升至最高级;NuScale SMR 首次临界;纽约州通过 12 个月数据中心禁建令;冰人 Ötzi 5300 年前微生物被复活;卡罗琳斯卡揭秘 Ozempic 失效机制;STAT 现场拆解三重激动剂。
Build 2026 大会上,微软 AI 主管 Suleyman 公开承认微软曾经只是 OpenAI 的「二道贩子」,并立志要成为全球第四个前沿 AI 实验室。这场酝酿了两年的「分手」背后,是 AI 行业从「超级联盟」走向「战国时代」的标志性转折。本文带你拆解:为什么微软选择此时独立、OpenAI 怎么防守、以及这对你我意味着什么。
Nature 2026 年 4 月发表的开创性研究揭示:大语言模型可以通过看似「无关」的训练数据,把自己的行为特征「潜意识地」传递给学生模型——这种现象叫 Subliminal Learning。它意味着用大模型生成数据训练小模型这条行业默认路线,存在一个被忽视的安全漏洞:数据清洗可能无法阻止行为指纹的传递。
当日 30 条新闻汇总:Microsoft 公开转向 Agent-First、Apple macOS 27 Tahoe + NVIDIA RTX Spark 同步应战;SpaceX 750 亿 IPO、Marvell 暴涨 32.5%、GitLab 14% 裁员、Uber 4 个月烧光 AI 工具预算,美联储释放鹰派降息信号;mRNA 个体化肿瘤疫苗 5 年随访降低 49% 复发、NHS 全国推广 CRISPR 镰状细胞病;伊朗向科威特/巴林发射导弹,2003 年以来美军在中东最大单日军事行动。
2026 年 5 月,OpenAI 内部研究模型推翻了困扰数学家 80 年的 Erdős 单位距离猜想——它用高维投影+代数整数给出反例,n^1.014 超过 Erdős 的 n^(1+o(1)) 上限。菲尔兹奖得主 Tim Gowers 第一反应是「数学家要完了」,确认是反例后松了半口气。这不是 AI 取代数学家,而是 AI 让数学家走得更快。
AI模型的记忆力一直是个大难题——传统方案依赖价格高昂的HBM内存,让普通开发者望而却步。但DeepSeek最新发布的Engram模型彻底改变了游戏规则:用普通DRAM替代HBM,在NIAH基准测试中依然达到97%准确率。这意味着AI普惠化可能真的不远了。
2026年4月24日,在震撼硅谷一周年之际,DeepSeek发布最新旗舰模型,在多项基准测试中表现优异,进一步缩小与西方顶级AI公司的差距。这是中国AI发展的重要里程碑,也是全球AI竞争格局演变的关键时刻。
OpenAI 发布 GPT-5 Turbo,推理速度比 GPT-4 快 3 倍,首次支持多模态推理能同时处理文本、图像和代码。这不仅是技术迭代,更是 OpenAI 在激烈市场竞争中的一次战略反攻。
DeepSeek-V4 通过 CSA/HCA 混合注意力、mHC 流形约束超连接、Muon 优化器三大核心技术创新,在 100 万 token 上下文场景下实现推理成本降至上一代的 27%、缓存占用降至 10% 的突破。
为什么一个AI模型同时擅长数学、编程、工具调用和写作这么难?DeepSeek-V4用两阶段后训练框架回答了这个问题——先让数学、编程、Agent、指令跟随各自独立成专家,再用逆向KL散度蒸馏把它们合为一体。详解专家独立训练+OPD全词汇表蒸馏的技术逻辑。
4月27日,蚂蚁灵光App正式上线业界首个移动端世界模型功能,用户上传图片即可在手机上探索3D世界。
深入解析 DeepSeek-V4 的 CSA/HCA 混合注意力、mHC 流形约束超连接、Muon 优化器三项核心技术突破,探讨其如何实现百万 Token 上下文与极致效率的平衡