每周AI大模型更新速递6.15~6.21

6月16日

【开源】Kimi开源Kimi K2.7 Code，一款面向真实软件工程场景的Coding智能体模型。该模型基于Kimi K2.6构建，重点优化长周期编码任务，在后端服务、基础设施、性能工程、系统编程与机器学习等复杂工作流中提升端到端完成能力。模型采用MoE架构，总参数1T、激活参数32B，支持256K上下文，并配备MoonViT视觉编码器；相比K2.6，推理token消耗进一步降低，适合长链路Agent编码任务。详情请参见

https://modelscope.cn/models/moonshotai/Kimi-K2.7-Code

直接体验：https://nonelinear.com/static/models.html

【开源】MiniMax开源MiniMax M3，国内首个同时具备原生多模态、超长上下文和Agent操作能力的模型。M3采用全新稀疏注意力架构MSA，最高支持1M上下文，并在长上下文下显著降低计算开销。模型在Coding方面相比M2明显增强，在bugfix、前后端开发和性能优化等场景接近海外闭源模型；在Agent能力方面，搜索、Office与金融场景表现也进一步提升。本次同步开源原始权重与MXFP8量化版，便于不同部署场景使用。详情请参见

https://www.modelscope.cn/collections/MiniMax/MiniMax-M3

直接体验：https://nonelinear.com/static/models.html

6月17日

【闭源】谷歌更新Gemini API语音生成能力，gemini-3.1-flash-tts-preview现在支持通过streamGenerateContent进行流式语音生成，也可在Interactions API中通过stream: true启用。该能力有助于降低语音生成的感知延迟，适合播客、有声内容、实时旁白和对话式语音应用等场景。详情请参见

https://ai.google.dev/gemini-api/docs/speech-generation?hl=zh-cn#streaming

【开源】智谱开源发布GLM-5.2，这是GLM面向长程任务的最新旗舰模型。相比GLM-5.1，GLM-5.2在长程任务、编码和Agent场景中显著增强，稳定支持100万token上下文，并提供多种推理投入级别，以平衡性能与延迟。架构上，模型提出IndexShare，在稀疏注意力层间复用索引器，降低长上下文计算开销；同时改进MTP层以支持推测解码。本次模型采用MIT协议开源，覆盖长程编码、终端任务和大规模工具调用等场景。详情请参见

https://modelscope.cn/collections/ZhipuAI/GLM-52

直接体验：https://nonelinear.com/static/models.html

非线智能官网模型列表

非线智能官网https://nonelinear.com 可连接超485+全球模型，支持一键Api聚合以及Api中转，提供稳定的企业级服务。登录github账号，领20-50元体验金。