第5页_AI框架_AI导航爱途网络

Kairos 3.0-4B – 大晓机器人开源的具身原生世界模型

Kairos 3.0-4B是大晓机器人开源的具身原生世界模型，首创"多模态理解—生成—预测"一体化架构。作为全球首个可端侧驱动机器人本体控制的4B轻量模型，在THOR平台实现1:1.5实时生成，推理速度较Cosmos 2.5提升72倍。

AI框架

2026-03-13

CLI-Anything – 港大开源代码转AI Agent的原生工具

CLI-Anything 是香港大学数据科学实验室（HKUDS）开源的工具，能将任意开源软件的代码库一键转化为 AI Agent 可用的命令行接口（CLI）。

AI框架

2026-03-11

Gemini Embedding 2 – 谷歌推出的首个原生多模态嵌入模型

Gemini Embedding 2 是谷歌首个原生多模态嵌入模型，基于 Gemini 架构构建。模型将文本、图像、视频、音频和文档统一映射到同一向量空间，支持跨 100 多种语言的语义理解。

AI框架

2026-03-11

gws – Google Workspace 团队开源的命令行工具

gws (Google Workspace CLI) 是 Google Workspace 团队开源的命令行工具，用 Rust 编写，通过 npm 分发。最大亮点是运行时动态构建命令，不依赖静态命令列表，实时读取 Google Discovery Service 自动支持所有 Workspace API（Drive、Gmail、Calendar、Sheets 等），Google 新增端点无需更新即

AI框架

2026-03-09

HY-WU – 腾讯混元开源的功能性神经记忆框架

HY-WU（混元无相）是腾讯混元推出的功能性神经记忆框架，能让AI在推理时实时生成个性化参数。框架通过Transformer参数生成器，在推理时根据输入实时合成个性化LoRA权重，动态注入冻结的基模，无需微调可实现实例级适配。

AI框架

2026-03-09

Symphony – OpenAI 开源的 Agent 编排系统

Symphony 是 OpenAI 开源的 Agent 编排系统，支持将项目工作转化为隔离的自主运行任务。Symphony能监控 Linear 等看板，自动调度 Agent 完成编码、测试到合并 PR 的全流程，提供 CI 状态、代码审查、演示视频等工作证明。

AI框架

2026-03-08

GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型

GPT-5.4是OpenAI推出的旗舰AI模型，定位为"专为专业工作设计的最强前沿模型"。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万Token上下文整合进单一模型，且未牺牲任何单项性能。

AI框架

2026-03-06

HiClaw – 阿里云开源的多Agent团队协作系统

HiClaw 是阿里开源的Agent 团队协作系统，定位"Team 版 OpenClaw"。系统引入 Manager Agent 作为 AI 管家，自动协调多个 Worker Agent 完成复杂任务。

AI框架

2026-03-06

MagicAgent – 荣耀联合复旦推出的智能体基础模型

MagicAgent是荣耀联合复旦大学推出的智能体基础模型，以32B密集架构和30B-A3B MoE架构实现百亿参数内最强性能。

AI框架

2026-03-04

GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型

GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型，专为优化日常聊天体验设计。模型显著改善"爱说教、太啰嗦"的机械语气，回答更直接自然，联网搜索时整合质量更高，能结合知识图谱提供深度分析，避免简单罗列链接。

AI框架

2026-03-04

Gemini 3.1 Flash-Lite – 谷歌推出的轻量级旗舰模型

Gemini 3.1 Flash-Lite是Google推出的轻量级旗舰模型，主打极致性价比。模型以每秒363 token的输出速度、0.25美元/百万token的输入价格，在速度上碾压GPT-5 mini（快5倍），价格为Claude 4.5 Haiku的四分之一。

AI框架

2026-03-04

Fun-AudioGen-VD – 阿里通义实验室推出的音色设计模型

Fun-AudioGen-VD 是阿里通义实验室语音团队推出的创新语音大模型，定位为面向"声音设计与场景化音频生成"的专业工具。模型支持"FreeStyle"自由指令生成，能根据自然语言描述，一次性生成包含特定音色、情绪表达和完整听觉场景的高质量音频，实现"人物+场景"的一体化声音创作。

AI框架

2026-03-03

OpenSandbox – 阿里巴巴开源的通用 AI 应用沙箱平台

OpenSandbox 是阿里巴巴开源的通用 AI 应用沙箱平台，采用 Apache 2.0 协议，专为安全执行 AI 生成代码和自动化任务而设计。提供多语言 SDK（Python、Java/Kotlin、JavaScript/TypeScript）和统一沙箱 API，内置 Docker 和 Kubernetes 运行时支持，可快速部署代码解释器、浏览器自动化、桌面环境（VNC/VS Code）等

AI框架

2026-03-01

TinyClaw – TinyAGI开源的轻量级多智能体协作框架

TinyClaw 是 TinyAGI 开源的轻量级多智能体协作框架，专为资源受限环境设计。TinyClaw支持在树莓派等设备上同时运行多个专业 AI Agent（如 @coder、@writer），智能体间可通过链式执行和扇出模式协作完成任务。

AI框架

2026-02-28

OpenFang – 开源AI Agent操作系统，自动执行完整工作流

OpenFang 是用 Rust 构建的开源 Agent 操作系统，核心创新是 Hands——7 个预置的自主能力包，让 AI 无需人工触发可 7×24 小时自动执行任务（如监控竞品、挖掘客户、剪辑视频）。

AI框架

2026-02-28

AngelSlim – 腾讯混元开源的全模态大模型压缩工具包

AngelSlim 是腾讯混元团队自研并开源的全模态大模型压缩工具包，通过量化、投机采样、稀疏化和蒸馏等技术，为大语言模型（LLM）、视觉语言模型（VLM）及语音模型提供高效、易用的压缩与加速解决方案。

AI框架

2026-02-28

SkyReels V4 – 昆仑万维推出的AI多模态视频基础模型

SkyReels V4是昆仑万维推出的视频基础模型，是全球首个支持多模态输入、联合音视频生成及统一生成/修复/编辑的AI视频模型。模型采用双流MMDiT架构，可生成1080p/32FPS/15秒影院级同步音视频。

AI框架

2026-02-27

Arrow 1.0 – Quiver AI推出的SVG原生AI生成模型

Arrow 1.0 是 Quiver AI 推出全球首款 SVG 原生 AI 生成模型。与传统像素生成模型不同，模型能直接输出可缩放矢量图形代码，图像基于数学公式构建，支持无限放大而不失真。

AI框架

2026-02-27

pplx-embed – Perplexity推出的系列文本嵌入模型

pplx-embed 是 Perplexity 推出的系列文本嵌入模型，包含标准检索的 pplx-embed-v1 和上下文感知的 pplx-embed-context-v1，均提供 0.6B 和 4B 两种规模。

AI框架

2026-02-27

LocoOperator-4B – LocoreMind开源的代码探索智能体模型

LocoOperator-4B 是 LocoreMind 开源的 4B 参数代码探索智能体，基于 Qwen3-4B-Instruct 通过知识蒸馏从 Qwen3-Coder-Next 训练而来。模型定位为 Claude Code 等编程助手的本地子智能体，专门处理代码库搜索、文件读取、目录遍历等探索任务，实现零 API 成本。

AI框架

2026-02-27

AI导航 爱途网络

AI框架

AI导航爱途网络