Chousei's 数字花园

  • Home
  • Articles
  • Privacy
  • Contact
DeepSeek Engram 打破AI内存瓶颈:不用昂贵的HBM,照样跑出97%准确率
AI

DeepSeek Engram 打破AI内存瓶颈:不用昂贵的HBM,照样跑出97%准确率

AI模型的记忆力一直是个大难题——传统方案依赖价格高昂的HBM内存,让普通开发者望而却步。但DeepSeek最新发布的Engram模型彻底改变了游戏规则:用普通DRAM替代HBM,在NIAH基准测试中依然达到97%准确率。这意味着AI普惠化可能真的不远了。

2026-05-20 04:32
DeepSeek震撼硅谷一周年:最新旗舰模型发布,挑战西方AI霸权
AI

DeepSeek震撼硅谷一周年:最新旗舰模型发布,挑战西方AI霸权

2026年4月24日,在震撼硅谷一周年之际,DeepSeek发布最新旗舰模型,在多项基准测试中表现优异,进一步缩小与西方顶级AI公司的差距。这是中国AI发展的重要里程碑,也是全球AI竞争格局演变的关键时刻。

2026-05-17 07:34
2026年5月8日科技与商业新闻汇总
新闻

2026年5月8日科技与商业新闻汇总

2026年5月8日科技与商业新闻汇总:英伟达中国市场份额归零、DeepSeek V4新动态、苹果WWDC焦点、AI安全警报等多个热点话题。

2026-05-09 00:51
DeepSeek-V4 如何让"百万 token 上下文"从不可能变成现实
技术解读

DeepSeek-V4 如何让"百万 token 上下文"从不可能变成现实

DeepSeek-V4 通过 CSA/HCA 混合注意力、mHC 流形约束超连接、Muon 优化器三大核心技术创新,在 100 万 token 上下文场景下实现推理成本降至上一代的 27%、缓存占用降至 10% 的突破。

2026-05-08 01:41
DeepSeek-V4 的后训练揭秘:让一个模型同时成为数学家、程序员和Agent
技术解读

DeepSeek-V4 的后训练揭秘:让一个模型同时成为数学家、程序员和Agent

为什么一个AI模型同时擅长数学、编程、工具调用和写作这么难?DeepSeek-V4用两阶段后训练框架回答了这个问题——先让数学、编程、Agent、指令跟随各自独立成专家,再用逆向KL散度蒸馏把它们合为一体。详解专家独立训练+OPD全词汇表蒸馏的技术逻辑。

2026-05-06 04:54
深度解读 DeepSeek-V4:三项核心技术创新
技术解读

深度解读 DeepSeek-V4:三项核心技术创新

深入解析 DeepSeek-V4 的 CSA/HCA 混合注意力、mHC 流形约束超连接、Muon 优化器三项核心技术突破,探讨其如何实现百万 Token 上下文与极致效率的平衡

2026-04-24 06:39
DeepSeek V4 重磅发布:打破闭源垄断,百万上下文成标配
AI

DeepSeek V4 重磅发布:打破闭源垄断,百万上下文成标配

DeepSeek-V4 正式发布,带来 Pro 和 Flash 两个版本。V4-Pro 对标顶级闭源模型,Agent 能力比肩 Opus 4.6;V4-Flash 则是性价比之选。百万上下文成为标配,下半年将支持华为算力。

2026-04-24 05:02
1

文章分类

  • AI 61
  • 新闻 67
  • 技术解读 34
  • 动漫 1
  • 游戏 3
  • 经济 1
  • 体育 1
  • 旅游 0
  • 教育 1
  • 文化 3
  • 商业 14
  • 健康 15
  • 科技 54
  • 信息安全 21
  • AI技术 11
  • 科学 6
  • 6 0

标签云

美食 1 Apple 6 科技 201 新闻 79 AI 227 创业 5 新能源 4 半导体 9 OpenAI 25 DeepSeek 7 大模型 21 长上下文 1 蚂蚁集团 1 研究 11 医疗 10 健康 18 技术解读 18 AI安全 40 开源 15 GitHub 2 动漫 0 二次元 0 日本 0 动画 0 春季番 0

Chousei's 数字花园

这里是 Chousei 的数字花园,记录了他的技术思考和生活经验。

Navigation

  • Home
  • Articles
  • Privacy
  • Contact

Contact

  • Email: admin<at>yesiam.monster
  • GitHub

© 2026 Chousei. All rights reserved.