AI框架

Fun-AudioGen-VD – 阿里通义实验室推出的音色设计模型

Fun-AudioGen-VD 是阿里通义实验室语音团队推出的创新语音大模型,定位为面向"声音设计与场景化音频生成"的专业工具。模型支持"FreeStyle"自由指令生成,能根据自然语言描述,一次性生成包含特定音色、情绪表达和完整听觉场景的高质量音频,实现"人物+场景"的一体化声音创作。

OpenSandbox – 阿里巴巴开源的通用 AI 应用沙箱平台

OpenSandbox 是阿里巴巴开源的通用 AI 应用沙箱平台,采用 Apache 2.0 协议,专为安全执行 AI 生成代码和自动化任务而设计。提供多语言 SDK(Python、Java/Kotlin、JavaScript/TypeScript)和统一沙箱 API,内置 Docker 和 Kubernetes 运行时支持,可快速部署代码解释器、浏览器自动化、桌面环境(VNC/VS Code)等

TinyClaw – TinyAGI开源的轻量级多智能体协作框架

TinyClaw 是 TinyAGI 开源的轻量级多智能体协作框架,专为资源受限环境设计。TinyClaw支持在树莓派等设备上同时运行多个专业 AI Agent(如 @coder、@writer),智能体间可通过链式执行和扇出模式协作完成任务。

OpenFang – 开源AI Agent操作系统,自动执行完整工作流

OpenFang 是用 Rust 构建的开源 Agent 操作系统,核心创新是 Hands——7 个预置的自主能力包,让 AI 无需人工触发可 7×24 小时自动执行任务(如监控竞品、挖掘客户、剪辑视频)。

AngelSlim – 腾讯混元开源的全模态大模型压缩工具包

AngelSlim 是腾讯混元团队自研并开源的全模态大模型压缩工具包,通过量化、投机采样、稀疏化和蒸馏等技术,为大语言模型(LLM)、视觉语言模型(VLM)及语音模型提供高效、易用的压缩与加速解决方案。

SkyReels V4 – 昆仑万维推出的AI多模态视频基础模型

SkyReels V4是昆仑万维推出的视频基础模型,是全球首个支持多模态输入、联合音视频生成及统一生成/修复/编辑的AI视频模型。模型采用双流MMDiT架构,可生成1080p/32FPS/15秒影院级同步音视频。

Arrow 1.0 – Quiver AI推出的SVG原生AI生成模型

Arrow 1.0 是 Quiver AI 推出全球首款 SVG 原生 AI 生成模型。与传统像素生成模型不同,模型能直接输出可缩放矢量图形代码,图像基于数学公式构建,支持无限放大而不失真。

pplx-embed – Perplexity推出的系列文本嵌入模型

pplx-embed 是 Perplexity 推出的系列文本嵌入模型,包含标准检索的 pplx-embed-v1 和上下文感知的 pplx-embed-context-v1,均提供 0.6B 和 4B 两种规模。

LocoOperator-4B – LocoreMind开源的代码探索智能体模型

LocoOperator-4B 是 LocoreMind 开源的 4B 参数代码探索智能体,基于 Qwen3-4B-Instruct 通过知识蒸馏从 Qwen3-Coder-Next 训练而来。模型定位为 Claude Code 等编程助手的本地子智能体,专门处理代码库搜索、文件读取、目录遍历等探索任务,实现零 API 成本。

Nano Banana 2 – 谷歌推出的新一代图像生成模型

Nano Banana 2 是 Google DeepMind 推出的新一代图像生成模型(Gemini 3.1 Flash Image)。模型接入 Gemini 知识库和实时网络搜索,可精准绘制真实场景、生成多语言文字,支持单次生成保持 5 个角色或 14 个物品的一致性。

MimiClaw – 开源超轻量级AI助手,无需高级运行环境

MimiClaw是基于ESP32-S3芯片的超轻量级AI助手,采用纯C语言编写,能直接在裸机上运行,无需Linux、Node.js或操作系统。

ClawFeed – 开源AI新闻摘要工具,智能提炼结构化摘要

ClawFeed 是开源的 AI 新闻摘要工具,能帮用户聚合 Twitter、RSS、HackerNews、Reddit、GitHub 等多平台信息源,通过 AI 智能筛选生成结构化摘要(支持 4小时/每日/每周/每月频率)。

FireRedASR2S – 小红书开源的语音识别模型

FireRedASR2S是小红书Super Intelligence-AudioLab开源的工业级端到端语音识别模型,集成ASR、VAD、语种识别和标点预测四大SOTA模块。

ZeroClaw – 开源的轻量级个人AI Agent运行框架

ZeroClaw 是基于 Rust 编写的轻量级AI助手基础设施,采用 Trait 驱动架构,将模型 Provider、通信 Channel、工具 Tool、内存 Memory 等核心能力抽象为可插拔接口,实现零厂商锁定——OpenAI、Claude、本地 Ollama 或 Telegram、Discord 均可一键切换。

PicoClaw – Sipeed推出的超轻量级AI Agent助手

PicoClaw是Sipeed推出的超轻量级AI Agent助手,用Go语言编写,专为低成本硬件设计。工具非本地运行大模型,是作为轻量客户端通过API调用云端模型(如Claude、GPT、智谱GLM等),同时在本地执行文件操作、网页搜索、任务规划等Agent能力。

Protenix-v1 – 字节Seed团队开源的生物分子结构预测模型

Protenix-v1 是字节跳动 Seed 团队开源的生物分子结构预测模型,是首个在严格对齐 AlphaFold 3 数据截止日(2021-09-30)、模型规模和推理预算条件下,性能达到甚至超越 AF3 的完全开源模型。

EvoMap – 首个面向 AI Agent 的经验共享开源网络协议

EvoMap 是全球首个面向 AI Agent 的经验遗传网络协议,通过 GEP(Genome Evolution Protocol,基因组进化协议),让 AI Agent 的能力像生物基因一样实现跨个体遗传、共享与进化。开发者可将 Agent 在任务中积累的有效策略封装为"基因胶囊"(Gene Capsule),这些胶囊包含完整决策链路、环境指纹和审计记录,非简单代码片段。

FireRed-Image-Edit – 小红书开源的通用图像编辑模型

FireRed-Image-Edit是小红书Super Intelligence团队开源的通用图像编辑模型,基于扩散架构,支持文本引导的图像编辑、老照片修复、虚拟试穿等多功能。

Qwen3.5 – 阿里通义千问开源的新一代原生多模态大模型

Qwen3.5是阿里巴巴通义千问团队正式发布并开源的新一代原生多模态大模型。首发开源版本Qwen3.5-397B-A17B采用创新的混合架构,将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)相结合,总参数达3970亿但每次推理仅激活170亿参数,实现"以小胜大"——性能超越万亿参数的Qwen3-Max,部署显存降低60%,推理吞吐量最高提升至19倍。

Seed2.0 – 字节跳动推出的系列通用模型

Seed2.0是字节跳动Seed团队推出的最新大模型系列,包含Pro(doubao-seed-2-0-pro-260215)、Lite(doubao-seed-2-0-lite-260215)、Mini(doubao-seed-2-0-mini-260215)三款通用Agent模型及专用Code(doubao-seed-2-0-code-preview-260215)模型。