第7页_AI框架_AI导航爱途网络

Riverflow 2.0 – Sourceful推出的图像生成与编辑模型

Riverflow 2.0是Sourceful推出的生产级图像生成与编辑模型，专为营销和创意团队设计。模型包含PRO和FAST两个版本：PRO追求极致质量与一致性，在文本渲染、提示遵循和真实感方面表现最强；FAST针对快速迭代优化，延迟更低、成本更优。

AI框架

2026-02-10

可灵3.0模型 – 快手可灵推出的新一代多模态AI创作模型

可灵AI 3.0是快手推出的新一代多模态AI创作模型，实现"All in One"原生创作工作流。模型版本更新包括，推出视频3.0支持AI智能分镜、15秒长视频生成、多语种口型同步（含方言）及图生视频主体参考；视频3.0 Omni强化全能参考与音色克隆。

AI框架

2026-02-05

玄武 CLI – 清昴智能开源的国产大模型部署工具

玄武 CLI（xw-cli）是清昴智能开源的国产大模型部署工具，专为华为昇腾、沐曦、燧原等国产芯片深度优化，通过自动硬件检测和智能引擎调度，让用户无需复杂配置可一键启动模型服务。

AI框架

2026-02-04

SoulX-FlashTalk – Soul App开源的实时数字人生成模型

SoulX-FlashTalk 是 Soul App 旗下 AI 团队开源的首个 14B 参数实时数字人生成模型，实现了 0.87 秒亚秒级延迟和 32fps 高帧率。

AI框架

2026-02-04

Qwen3-Coder-Next – 通义千问开源的编程智能体MoE模型

Qwen3-Coder-Next 是阿里 Qwen 团队开源的编程智能体模型，采用混合专家（MoE）架构，总参数 80B 每次推理仅激活 3B，大幅降低显存与算力成本。

AI框架

2026-02-04

Step 3.5 Flash – 阶跃星辰最新开源的基座模型

Step 3.5 Flash 是阶跃星辰最新开源的基座模型，专为 Agent 场景推出。模型采用稀疏 MoE 架构，总参数 1960 亿，每 token 仅激活 110 亿参数，兼顾性能与效率。

AI框架

2026-02-02

Mureka V8 – 昆仑万维推出的AI音乐模型

Mureka V8是昆仑万维推出的AI音乐大模型，基于MusiCoT（Music Chain-of-Thought）技术架构，实现从声音拼接到类人创作逻辑的跨越。

AI框架

2026-01-29

MiniMax-M2-her – MiniMax推出的AI角色扮演模型

MiniMax-M2-her 是 MiniMax 专深度 AI 陪伴场景推出的角色扮演模型，是服务星野/Talkie 的底层模型。模型通过三大核心能力，独特的世界体验、有节奏的故事推进、精准的用户偏好理解，解决长对话中的角色崩坏、剧情重复等痛点。

AI框架

2026-01-29

MiniMax Music 2.5 – MiniMax推出的AI音乐创作模型

MiniMax Music 2.5是MiniMax推出的新一代AI音乐创作模型，在「段落级强控制」与「物理级高保真」两大技术难题上实现突破。模型支持14种音乐结构标签（如前奏、副歌、桥段等）的精准控制，让创作者能像专业编曲人一样设计情绪曲线。

AI框架

2026-01-29

Kimi K2.5 – 月之暗面kimi开源的全新一代全能旗舰模型

Kimi K2.5 是月之暗面开源的全新一代全能旗舰模型，模型基于约 15T 视觉与文本数据训练而成，具备顶尖的代码生成、视觉理解能力，支持自主 Agent 集群协作，可调度多达 100 个子 Agent 并行处理复杂任务，执行效率大幅提升。

AI框架

2026-01-27

AgentCPM-Report – 清华联合面壁智能等开源的写作智能体

AgentCPM-Report 是清华大学自然语言处理实验室、中国人民大学、面壁智能与 OpenBMB 开源社区联合推出的本地化深度调研智能体，基于8B参数的MiniCPM4.1模型。

AI框架

2026-01-22

Step3-VL-10B – 阶跃星辰开源的多模态小模型

Step3-VL-10B 是阶跃星辰推出的仅含 10B 参数的开源多模态模型，在视觉感知、逻辑推理、数学竞赛和通用对话等任务中达到 200B 参数模型的性能水平。

AI框架

2026-01-21

COTA – 超参数科技推出的新型游戏智能体

COTA是超参数科技推出的新型游戏智能体，基于大语言模型（LLM）驱动，具备认知、操作、战术和辅助能力。COTA突破传统强化学习与监督学习模式，通过架构创新实现百毫秒级响应，达到真人高分玩家水平。

AI框架

2026-01-20

GLM-Image – 智谱联合华为开源的多模态图像生成模型

GLM-Image 是智谱联合华为开源的新一代多模态图像生成模型，基于昇腾 Atlas 800T A2 设备和昇思 MindSpore 框架训练，是首个全流程国产芯片训练的 SOTA 模型。

AI框架

2026-01-14

Engram – DeepSeek联合北大推出的条件记忆模块

Engram 是DeepSeek团队联合北京大学推出的条件记忆模块，能提升大语言模型（LLM）的性能。Engram通过引入现代化的 -gram 嵌入表，将静态知识存储在独立的内存中，用稀疏检索和上下文感知门控技术实现高效的知识查找。

AI框架

2026-01-13

Baichuan-M3 – 百川智能开源的新一代医疗增强大语言模型

Baichuan-M3是百川智能正式发布的新一代开源医疗增强大语言模型。模型在问诊能力、医疗幻觉控制以及Healthbench和Healthbench Hard评测中均排名第一，超越了OpenAI的GPT-5.2，在所有测试环节中超越了人类医生的表现。

AI框架

2026-01-13

Qwen3-VL-Embedding – 阿里通义开源的多模态信息检索模型

Qwen3-VL-Embedding 是阿里通义推出的多模态信息检索模型，专为处理文本、图像、可视化文档和视频等多种模态输入而设计。模型基于强大的 Qwen3-VL 架构，能将不同模态的数据映射到统一的语义空间，生成语义丰富的高维向量。

AI框架

2026-01-13

DeepTutor – 香港大学开源的AI学习助手

DeepTutor 是香港大学数据科学实验室开源的 AI 学习助手，通过多智能体架构和知识图谱技术，将复杂的知识体系转化为高效的学习体验。

AI框架

2026-01-13

Qwen3-VL-Reranker – 阿里通义开源的跨模态理解模型

Qwen3-VL-Reranker 是阿里通义基于 Qwen3-VL 构建的跨模态理解模型，专为多模态信息检索设计。模型接收任意模态组合的查询与文档对（如图文查询匹配图文文档），通过单塔架构和交叉注意力机制，深度分析语义关联，输出精确的相关性分数。

AI框架

2026-01-13

Nemotron Speech ASR – 英伟达开源的语音识别模型

Nemotron Speech ASR 是英伟达开源的专注于低延迟、实时流式语音识别的模型。通过缓存感知架构，将已处理的语音特征缓存，仅对新音频帧进行计算，实现单句转录锁定仅需24毫秒，有效解决了传统流式模型在长语音识别中的累积延迟问题。

AI框架

2026-01-13

AI导航 爱途网络

AI框架

AI导航爱途网络