
6月16日
【开源】Kimi开源Kimi K2.7 Code,一款面向真实软件工程场景的Coding智能体模型。该模型基于Kimi K2.6构建,重点优化长周期编码任务,在后端服务、基础设施、性能工程、系统编程与机器学习等复杂工作流中提升端到端完成能力。模型采用MoE架构,总参数1T、激活参数32B,支持256K上下文,并配备MoonViT视觉编码器;相比K2.6,推理token消耗进一步降低,适合长链路Agent编码任务。详情请参见
https://modelscope.cn/models/moonshotai/Kimi-K2.7-Code
直接体验:https://nonelinear.com/static/models.html
【开源】MiniMax开源MiniMax M3,国内首个同时具备原生多模态、超长上下文和Agent操作能力的模型。M3采用全新稀疏注意力架构MSA,最高支持1M上下文,并在长上下文下显著降低计算开销。模型在Coding方面相比M2明显增强,在bugfix、前后端开发和性能优化等场景接近海外闭源模型;在Agent能力方面,搜索、Office与金融场景表现也进一步提升。本次同步开源原始权重与MXFP8量化版,便于不同部署场景使用。详情请参见
https://www.modelscope.cn/collections/MiniMax/MiniMax-M3
直接体验:https://nonelinear.com/static/models.html
6月17日
【闭源】谷歌更新Gemini API语音生成能力,gemini-3.1-flash-tts-preview现在支持通过streamGenerateContent进行流式语音生成,也可在Interactions API中通过stream: true启用。该能力有助于降低语音生成的感知延迟,适合播客、有声内容、实时旁白和对话式语音应用等场景。详情请参见
https://ai.google.dev/gemini-api/docs/speech-generation?hl=zh-cn#streaming
【开源】智谱开源发布GLM-5.2,这是GLM面向长程任务的最新旗舰模型。相比GLM-5.1,GLM-5.2在长程任务、编码和Agent场景中显著增强,稳定支持100万token上下文,并提供多种推理投入级别,以平衡性能与延迟。架构上,模型提出IndexShare,在稀疏注意力层间复用索引器,降低长上下文计算开销;同时改进MTP层以支持推测解码。本次模型采用MIT协议开源,覆盖长程编码、终端任务和大规模工具调用等场景。详情请参见
https://modelscope.cn/collections/ZhipuAI/GLM-52
直接体验:https://nonelinear.com/static/models.html
