
5月1日
【开源】Mistral发布Mistral Medium 3.5,首次将指令遵循(Medium 3.1)、推理(Magistral)和编码(Devstral 2)三条模型线统一为单一128B稠密模型,256K上下文窗口,开源权重支持商业使用,最少4块GPU(80GB+显存)即可自部署。详情请参见
https://modelscope.cn/models/mistralai/Mistral-Medium-3.5-128B
【开源】蚂蚁百灵团队发布Ling-2.6-1T,万亿级综合旗舰模型,依托MLA与Linear Attention的Hybrid架构创新,强调多步执行稳定性与高智效比。在Artificial Analysis评测中仅用约16M output tokens即达到约34分Intelligence Index,与GPT-5.4(Non-Reasoning)同档。详情请见
https://www.modelscope.cn/models/inclusionAI/Ling-2.6-1T
5月5日
【闭源】谷歌更新文件搜索(File Search)功能,支持多模态搜索。现可使用gemini-embedding-2模型以原生方式嵌入图片并搜索图片,接地元数据新增media_id(用于视觉引用)和page_numbers(用于指示信息来源)。详情请参见
https://ai.google.dev/gemini-api/docs/file-search?hl=zh-cn
5月6日
【闭源】xAI发布grok-4.3,原生支持百万级(1M)上下文窗口,具备可配置推理能力(支持none/low/medium/high四档),并集成函数调用与结构化输出。定价方面,输入$1.25/百万tokens,缓存输入低至$0.20/百万tokens,输出$2.50/百万tokens。详情请参见
https://docs.x.ai/developers/models/grok-4.3
国内体验:https://nonelinear.com/static/models.html
【闭源】阿里发布fun-music-v1(百聆音乐生成大模型),支持输入开放性歌曲的创作要求或歌词,生成整首男/女声演唱的中文或英文歌曲,歌曲通俗易懂、情绪由浅入深,是人类灵感与大模型能力的完美结合。详情请参见
https://help.aliyun.com/zh/model-studio/fun-music
5月7日
【闭源】谷歌发布Gemini 3.1 Flash-Lite正式版(GA),该模型在速度、规模和成本效益方面进行了深度优化,是Gemini 3.1系列中面向高吞吐、低成本场景的轻量旗舰。详情请参见
https://ai.google.dev/gemini-api/docs/models/gemini-3.1-flash-lite?hl=zh-cn
国内体验:https://nonelinear.com/static/models.html
大模型/agent评测技术交流:关注公众号,发送消息"进群"。同时,非线智能API支持Api聚合以及Api中转,提供稳定的企业级服务。