每周AI大模型更新速递5.1~5.10 · 非线智能 NoneLinear

引自非线智能（GitHub 第一 AI 商业测评） - 每周AI大模型更新速递5.1~5.10

5月1日

【开源】Mistral发布Mistral Medium 3.5，首次将指令遵循（Medium 3.1）、推理（Magistral）和编码（Devstral 2）三条模型线统一为单一128B稠密模型，256K上下文窗口，开源权重支持商业使用，最少4块GPU（80GB+显存）即可自部署。详情请参见

https://modelscope.cn/models/mistralai/Mistral-Medium-3.5-128B

【开源】蚂蚁百灵团队发布Ling-2.6-1T，万亿级综合旗舰模型，依托MLA与Linear Attention的Hybrid架构创新，强调多步执行稳定性与高智效比。在Artificial Analysis评测中仅用约16M output tokens即达到约34分Intelligence Index，与GPT-5.4（Non-Reasoning）同档。详情请见

https://www.modelscope.cn/models/inclusionAI/Ling-2.6-1T

5月5日

【闭源】谷歌更新文件搜索（File Search）功能，支持多模态搜索。现可使用gemini-embedding-2模型以原生方式嵌入图片并搜索图片，接地元数据新增media_id（用于视觉引用）和page_numbers（用于指示信息来源）。详情请参见

https://ai.google.dev/gemini-api/docs/file-search?hl=zh-cn

5月6日

【闭源】xAI发布grok-4.3，原生支持百万级（1M）上下文窗口，具备可配置推理能力（支持none/low/medium/high四档），并集成函数调用与结构化输出。定价方面，输入$1.25/百万tokens，缓存输入低至$0.20/百万tokens，输出$2.50/百万tokens。详情请参见

https://docs.x.ai/developers/models/grok-4.3

国内体验：https://nonelinear.com/static/models.html

【闭源】阿里发布fun-music-v1（百聆音乐生成大模型），支持输入开放性歌曲的创作要求或歌词，生成整首男/女声演唱的中文或英文歌曲，歌曲通俗易懂、情绪由浅入深，是人类灵感与大模型能力的完美结合。详情请参见

https://help.aliyun.com/zh/model-studio/fun-music

5月7日

【闭源】谷歌发布Gemini 3.1 Flash-Lite正式版（GA），该模型在速度、规模和成本效益方面进行了深度优化，是Gemini 3.1系列中面向高吞吐、低成本场景的轻量旗舰。详情请参见

https://ai.google.dev/gemini-api/docs/models/gemini-3.1-flash-lite?hl=zh-cn

国内体验：https://nonelinear.com/static/models.html

大模型/agent评测技术交流：关注公众号，发送消息"进群"。同时，非线智能API支持Api聚合以及Api中转，提供稳定的企业级服务。