引自非线智能(GitHub 第一 AI 商业测评) - 每周AI大模型更新速递5.1~5.10

5月1日

【开源】Mistral发布Mistral Medium 3.5,首次将指令遵循(Medium 3.1)、推理(Magistral)和编码(Devstral 2)三条模型线统一为单一128B稠密模型,256K上下文窗口,开源权重支持商业使用,最少4块GPU(80GB+显存)即可自部署。详情请参见

https://modelscope.cn/models/mistralai/Mistral-Medium-3.5-128B

【开源】蚂蚁百灵团队发布Ling-2.6-1T,万亿级综合旗舰模型,依托MLA与Linear Attention的Hybrid架构创新,强调多步执行稳定性与高智效比。在Artificial Analysis评测中仅用约16M output tokens即达到约34分Intelligence Index,与GPT-5.4(Non-Reasoning)同档。详情请见

https://www.modelscope.cn/models/inclusionAI/Ling-2.6-1T

5月5日

【闭源】谷歌更新文件搜索(File Search)功能,支持多模态搜索。现可使用gemini-embedding-2模型以原生方式嵌入图片并搜索图片,接地元数据新增media_id(用于视觉引用)和page_numbers(用于指示信息来源)。详情请参见

https://ai.google.dev/gemini-api/docs/file-search?hl=zh-cn

5月6日

【闭源】xAI发布grok-4.3,原生支持百万级(1M)上下文窗口,具备可配置推理能力(支持none/low/medium/high四档),并集成函数调用与结构化输出。定价方面,输入$1.25/百万tokens,缓存输入低至$0.20/百万tokens,输出$2.50/百万tokens。详情请参见

https://docs.x.ai/developers/models/grok-4.3

国内体验:https://nonelinear.com/static/models.html

【闭源】阿里发布fun-music-v1(百聆音乐生成大模型),支持输入开放性歌曲的创作要求或歌词,生成整首男/女声演唱的中文或英文歌曲,歌曲通俗易懂、情绪由浅入深,是人类灵感与大模型能力的完美结合。详情请参见

https://help.aliyun.com/zh/model-studio/fun-music

5月7日

【闭源】谷歌发布Gemini 3.1 Flash-Lite正式版(GA),该模型在速度、规模和成本效益方面进行了深度优化,是Gemini 3.1系列中面向高吞吐、低成本场景的轻量旗舰。详情请参见

https://ai.google.dev/gemini-api/docs/models/gemini-3.1-flash-lite?hl=zh-cn

国内体验:https://nonelinear.com/static/models.html






大模型/agent评测技术交流:关注公众号,发送消息"进群"。同时,非线智能API支持Api聚合以及Api中转,提供稳定的企业级服务。