东方财富
📅 04/26 00:00
MSFT.OGOOG.OAMZN.O
Deepseek V4上线,或催化国产AI板块 4月24日,DeepSeek-V4系列模型上线并同步开源,其中pro版本主要为满足高性能研发,总参数1.6T,激活参数49B,支持上下文长度1M;flash版本主要为满足经济高效部署需求,总参数284B,激活参数13B,支持上下文长度1M。DeepSeek-V4开创了一种全新注意力机制,能够在token维度进行压缩,结合DSA稀疏注意力机制实现了全球...
Deepseek V4上线,或催化国产AI板块 4月24日,DeepSeek-V4系列模型上线并同步开源,其中pro版本主要为满足高性能研发,总参数1.6T,激活参数49B,支持上下文长度1M;flash版本主要为满足经济高效部署需求,总参数284B,激活参数13B,支持上下文长度1M。DeepSeek-V4开创了一种全新注意力机制,能够在token维度进行压缩,结合DSA稀疏注意力机制实现了全球领先的百万字上下文能力。适配方面,华为云表示旗下产品华为云MaaS模型即服务平台已提供支持,提供免部署、一键调用DeepSeek-V4-Flash API的Tokens服务。 前沿大模型GPT-5.5发布,谷歌和Anthropic双强联手,重视海外链4月23日,OpenAI正式发布新版本模型GPT-5.5和GPT-5.5Pro,目前已向ChatGPT和Codex付费用户开放。GPT-5.5在编程、专业任务、科研等领域全方面领先Anthropic的Claude Opus4.7以及谷歌的Gemini3.1Pro。 4月24日,谷歌表示计划向Anthropic投资最高400亿美元,用于扩大双方长期合作关系并强化AI赛道布局,本次投资先以现金形式投入100亿美元,剩余300亿美元则取决于Anthropic业绩目标达成情况。从云业务方面来看,谷歌已经通过云业务向其客户提供Anthropic旗下Claude模型接入服务,并开始与亚马逊云服务AWS和微软云服务Azure展开竞争。 4月22日,谷歌在Google Cloud Next'26发布第八代TPU。其中,TPU8t面向大规模训练,Scale up方面,8t沿用3D Torus拓扑,单SuperPod超节点从9216颗芯片扩容至9600颗,共享高带宽内存达2PB,芯片间互联(ICI)带宽较上一代提升2倍;Scale out方面,v8引入全新的Virgo网络架构,单芯片横向扩展带宽从100Gbps跃升至400Gbps,单Virgo网络可连接13.4万颗TPU,可扩展至百万级TPU集群。TPU8i面向高并发推理,Scale up方面,8i采用采用全新的Boardfly互联拓扑,相较于3D Torus,将1024芯片配置下片最大跳转次数从16跳压缩至7跳,单SuperPod超节点从256颗 芯片跃升至1152颗;Scale out方面,8...