第8页_AI框架_AI导航爱途网络

FantasyWorld – 高德地图联合北邮推出的3D世界建模框架

FantasyWorld是高德地图（AMAP）和北京邮电大学合作开发的创新性3D世界建模框架，专注于通过统一的视频和3D预测生成高质量的3D场景。框架通过在冻结的视频基础模型中增加可训练的几何分支，实现了视频潜变量和隐式3D场的联合建模

AI框架

2026-01-13

Obsidian-skills – Obsidian推出的开源AI工具包

Obsidian-skills 是 Obsidian 团队开发的一组开源工具，帮助用户更好地将 AI 工具（如 Claude Code）与 Obsidian 笔记系统结合使用。包含三大核心技能：obsidian-markdown、obsidian-bases 和 json-canvas。

AI框架

2026-01-13

女娲智能体OS – 首个产品级开源的通用智能体操作系统

女娲智能体OS（Nuwax Agent OS）是全球首个产品级开源的通用智能体操作系统。女娲智能体OS支持将AI从单纯的对话工具转变为企业的智能执行者，通过自主执行引擎实现从需求拆解到任务执行的全链路自动化。

AI框架

2026-01-13

Spirit-v1.5 – 千寻智能推出的具身智能基础模型

Spirit-v1.5 是千寻智能推出的具身智能基础模型。模型采用多样化、开放式的数据采集方式，摒弃传统“干净数据”的限制，让模型在预训练阶段接触更丰富的动作和场景，具备更强的泛化能力和适应性。

AI框架

2026-01-13

Oh My OpenCode – AI编程助手增强插件，自动调度任务

Oh My OpenCode 是为 AI 编程助手设计的开源增强插件，能让 AI （如OpenCode ）像真正的开发团队一样高效协作，提升编程体验。工具通过集成多种 AI 模型（如 OpenAI、Gemini、Claude 等），为开发者提供强大的编程助手。

AI框架

2026-01-13

Tencent-HY-MT1.5 – 腾讯混元开源的翻译模型

Tencent-HY-MT1.5 是腾讯混元开源的翻译模型，包含两个版本Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B。模型支持33种国际语言互译及5种民汉/方言翻译，覆盖多种小语种。

AI框架

2025-12-30

PersonaLive – 澳门大学等开源的实时AI换脸直播工具

PersonaLive 是澳门大学和 GVC 实验室开源的实时数字人直播工具。工具能在单张 12GB 显存的消费级显卡上运行，实现无限时长的肖像动画生成，支持低延迟互动。

AI框架

2025-12-30

Yume1.5 – 上海AI Lab联合复旦开源的交互式世界生成模型

Yume1.5 是上海人工智能实验室和复旦大学等推出的交互式世界生成模型，能从单张图像或文本提示生成逼真、连续且可探索的虚拟世界。

AI框架

2025-12-30

Computer Use Preview – 谷歌开源的AI浏览器自动化工具

Computer Use Preview 是谷歌开源的 AI 浏览器自动化工具。工具基于 Gemini 模型的视觉识别能力，通过“截图 - 分析 - 行动”能模拟人类操作网页，无需依赖固定的元素定位。

AI框架

2025-12-30

MAI-UI – 阿里通义开源的全尺寸GUI智能体基座模型

MAI-UI 是通义实验室推出的全尺寸 GUI 智能体基座模型，具备用户交互、工具调用和端云协同三大核心能力。框架通过自主进化数据管线和大规模在线强化学习技术，实现了从 2B 到 235B-A22B 的全尺寸覆盖，适用于多种场景。

AI框架

2025-12-29

QwenLong-L1.5 – 阿里通义开源的长文本推理模型

QwenLong-L1.5 是阿里通义实验室推出的专注于长文本推理的大语言模型。模型基于 Qwen3-30B-A3B 架构，通过系统化的后训练方案，显著提升长文本推理能力。

AI框架

2025-12-26

ML-Master 2.0 – SciMaster推出的自主机器学习智能体

ML-Master 2.0 是上海交通大学人工智能学院、上海算法创新研究院、深势科技组成的SciMaster团队推出的面向真实机器学习科研任务的自主智能体。ML-Master 2.0基于国产开源大模型 DeepSeek，具备超长程自主能力，能在长时间科研任务中不断试错、积累经验和自我演化。

AI框架

2025-12-25

Infographic – 阿里AntV团队开源的信息图生成框架

Infographic 是阿里前端 AntV 团队开源的新一代信息图框架。框架基于 G2 可视化引擎和 Ant Design，能快速生成高质量、稳定的信息图。

AI框架

2025-12-25

QuantiPhy – 李飞飞团队推出的VLM物理推理量化评估基准

QuantiPhy 是斯坦福大学李飞飞团队推出的首个量化评估视觉 - 语言模型（VLM）物理推理能力的基准。QuantiPhy 通过 3300 多个视频 - 文本实例，要求模型基于视频和物理先验（如物体尺寸、速度等），定量推理物体的运动学属性（如大小、速度、加速度）。

AI框架

2025-12-25

TurboDiffusion – 清华大学等推出的视频生成加速框架

TurboDiffusion 是清华大学、生数科技和加州大学伯克利分校联合推出的视频生成加速框架。框架通过 SageAttention、SLA（稀疏线性注意力）和 rCM（时间步蒸馏）等技术，将视频生成速度提升 100~200 倍，能在单张 RTX 5090 显卡上将原本 184 秒的生成任务缩短到 1.9 秒。

AI框架

2025-12-24

Seed Prover 1.5 – 字节跳动推出的新一代数学推理模型

Seed Prover 1.5 是字节跳动 Seed 团队推出的新一代形式化数学推理模型。模型采用创新的 Agentic Prover 架构，通过大规模强化学习（Agentic RL）训练，显著提升数学推理能力和效率。

AI框架

2025-12-24

MedASR – 谷歌开源的医疗语音识别模型

MedASR 是 Google 推出的专注于医学领域的语音识别模型，基于 Conformer 架构，拥有 105M 参数。模型通过大量医学语音数据（约 5000 小时）进行预训练，涵盖医生口述和临床对话等多种场景，能精准识别复杂医学术语和专业上下文。

AI框架

2025-12-24

MiniMax M2.1 – MiniMax推出的多语言编程AI模型

MiniMax M2.1 是 MiniMax推出的多语言编程AI 模型。模型系统性提升了 Rust、Java、Golang 等多语言能力，覆盖从底层到应用层开发。

AI框架

2025-12-23

Qwen-Image-Layered – 阿里推出的AI图像编辑模型

Qwen-Image-Layered是阿里团队推出的AI图像编辑模型，能将普通图片自动拆分为独立的RGB透明图层，实现类似Photoshop的分层编辑功能。通过注意力机制和位置编码动态拆分图层，支持3-10层的灵活分解

AI框架

2025-12-20

EcomBench – 阿里通义等推出的电商AI能力评测基准

EcomBench 是通义实验室联合 SKYLENAGE 推出的针对电商场景的 AI 能力评测基准。EcomBench 基于真实世界数据构建，涵盖政策咨询、成本估算、选品决策等七大类电商任务，全面衡量智能体在电商环境下的综合能力

AI框架

2025-12-19

AI导航 爱途网络

AI框架

AI导航爱途网络