AI框架

Veo 3.1 Lite – 谷歌推出的 AI 视频生成模型

Veo 3.1 Lite 是 Google 最新推出的AI视频生成模型,成本比 Veo 3.1 Fast 降低 50% 以上,同时保持同等生成速度。模型支持文本/图像生成视频,可灵活切换横竖屏(16:9/9:16)与 720p/1080p 分辨率,提供 4/6/8 秒三种时长选项。

ColaMD – 开源 Markdown 编辑器,实时同步修改内容

ColaMD 是开源的 Markdown 编辑器。工具解决了传统编辑器在 AI 修改文件后需手动刷新才能看到更新的痛点,实现 Agent 后台修改与前台内容的实时同步,如同观看 AI 现场写作。

harrier-oss-v1 – 微软开源的多语言文本嵌入模型

harrier-oss-v1 是微软开源的多语言文本嵌入模型,在 Multilingual MTEB v2 基准测试中取得 SOTA 成绩。模型采用仅解码器架构,通过最后 token 池化和 L2 归一化生成密集向量,适用检索、聚类、语义相似度、分类等任务。

LongCat-AudioDiT – 美团开源的文本转语音模型

LongCat-AudioDiT 是美团开源的高保真扩散式文本转语音(TTS)模型,核心创新在于直接在波形潜空间进行扩散生成,非传统梅尔频谱等中间表示,有效避免误差累积并大幅简化流程。

wecom-cli – 企业微信官方开源的命令行工具

wecom-cli(企业微信 CLI) 是企业微信官方团队开源的命令行工具,让人类和 AI Agent 能在终端中操作企业微信。工具覆盖通讯录、待办、会议、消息、日程、文档、智能表格 7 大核心能力,提供 12 个开箱即用的 AI Agent Skills,适配主流 AI 工具。

Mureka V9 – 昆仑万维推出的最新AI音乐模型

Mureka V9 是昆仑万维推出的最新AI音乐大模型。模型在音乐旋律性、表现力、编配编曲等核心指标上全面超越Suno V5等竞品,登顶Artificial Analysis人声和乐器双榜单全球第一。

OpenCLI – 开源 AI 命令行工具,网站一键转为命令行接口

OpenCLI 是开源的命令行工具,能将任意网站和 Electron 桌面应用转化为命令行接口。工具通过 Chrome 浏览器扩展连接本地守护进程,复用用户已登录的账号权限,无需额外配置 API 密钥。

MiniMax Office Skills – 稀宇科技开源的生产级办公文档引擎

MiniMax Office Skills 是稀宇科技开源的一套生产级办公文档引擎。工具包含四个核心组件,MiniMax-docx(Word)、MiniMax-xlsx(Excel)、MiniMax-pdf(PDF)和 PPTX-generator(PPT)。

New API – 开源的AI大模型网关与资产管理系统

New API 是新一代 AI 网关与资产管理系统,作为 AI 基座平台,提供统一基础设施接入全球 30+ 主流 AI 服务(OpenAI、Claude、Gemini、DeepSeek 等)。

ChatClaw – 智麻开源的AI智能体,支持多平台接入

ChatClaw是智麻开源的AI智能体,30MB极小安装包支持macOS/Windows/Linux。工具内置本地知识库、技能市场、MCP扩展、长期记忆和计划任务,可接入钉钉、飞书、企微、QQ等10+通讯平台。

EdgeClaw – 面壁智能联合清华等开源的AI智能体框架

EdgeClaw 是面壁智能联合清华、OpenBMB 推出的开源 AI 智能体框架,主打端云协同、本地部署、安全可控。框架首创三层数据安全协议(S1/S2/S3),让公开信息上云、敏感数据脱敏、隐私内容锁死本地;搭配双轨记忆机制和 GuardAgent 协议,实现全流程数据管控。

NemoClaw – 英伟达开源的企业级AI Agent框架

NemoClaw是英伟达开源的企业级AI Agent框架。NemoClaw作为OpenClaw插件运行,通过OpenShell运行时提供安全沙箱和策略引擎,解决企业使用AI Agent的安全顾虑。

Mistral Small 4 – Mistral AI开源的多模态大模型

Mistral Small 4 是 Mistral AI 开源的多模态大模型,模型首次将推理(Magistral)、多模态(Pixtral)和智能体编码(Devstral)能力统一于单一架构,支持文本与图像输入,可通过 reasoning_effort 参数灵活切换快速响应与深度推理模式。

Leanstral – Mistral AI推出的首个开源AI代码智能体

Leanstral 是Mistral AI推出的首个开源AI代码智能体,专为Lean 4定理证明器设计。模型采用120B总参数/6B激活参数的稀疏架构,能自动生成形式化证明并验证代码正确性。

GPT-5.4 nano – OpenAI推出的轻量、快速级 AI 模型

GPT-5.4 nano 是 OpenAI 推出的最轻量、最快速的 GPT-5.4 版本,专为对速度和成本要求极高的简单高吞吐量任务设计。

GPT-5.4 mini – OpenAI推出的最强小型模型

GPT-5.4 mini是OpenAI推出的最强小型模型,专为高吞吐量、低延迟场景设计。模型比前代GPT-5 mini快2倍以上,在编程、推理、多模态理解和计算机使用等任务中性能接近满血版GPT-5.4,价格仅为其1/3。

MindVLA-o1 – 理想推出的下一代自动驾驶基础模型

MindVLA-o1是理想汽车推出的下一代自动驾驶基础模型,采用原生多模态MoE架构,统一融合视觉、语言、行为三种模态。

OpenJarvis – 斯坦福大学开源的本地 AI 智能体框架

OpenJarvis 是斯坦福大学 Scaling Intelligence Lab 推出的开源本地 AI 智能体框架,核心理念是让 AI 执行完全本地化,将云端调用作为可选项。框架提供统一的模型目录层、硬件感知推理引擎、智能体编排系统、工具记忆与学习优化五大模块,支持通过 pip install openjarvis 一键安装,提供浏览器、桌面应用、Python SDK 和 CLI 四种交互方式

Paperclip – 开源的AI Agent编排平台,自主运营AI公司

Paperclip 是开源的AI Agent编排平台,支持用户把多个 AI Agent(如 OpenClaw、Claude、Cursor)组织成一家真正的"赛博公司"。平台提供完整的企业管理架构:组织架构、目标对齐、任务委派、预算控制和治理审计。

Clawith – 开源多智能体协作框架,OpenClaw团队协作版

Clawith是面向企业的开源混合多智能体协作框架,将AI Agent视为"数字员工"非简单聊天工具。每个Agent拥有持久身份(soul.md)、长期记忆(memory.md)和独立工作空间,能理解组织架构并与人类/其他Agent协作。