AI框架
Kairos 3.0-4B – 大晓机器人开源的具身原生世界模型
Kairos 3.0-4B是大晓机器人开源的具身原生世界模型,首创"多模态理解—生成—预测"一体化架构。作为全球首个可端侧驱动机器人本体控制的4B轻量模型,在THOR平台实现1:1.5实时生成,推理速度较Cosmos 2.5提升72倍。
CLI-Anything – 港大开源代码转AI Agent的原生工具
CLI-Anything 是香港大学数据科学实验室(HKUDS)开源的工具,能将任意开源软件的代码库一键转化为 AI Agent 可用的命令行接口(CLI)。
Gemini Embedding 2 – 谷歌推出的首个原生多模态嵌入模型
Gemini Embedding 2 是谷歌首个原生多模态嵌入模型,基于 Gemini 架构构建。模型将文本、图像、视频、音频和文档统一映射到同一向量空间,支持跨 100 多种语言的语义理解。
gws – Google Workspace 团队开源的命令行工具
gws (Google Workspace CLI) 是 Google Workspace 团队开源的命令行工具,用 Rust 编写,通过 npm 分发。最大亮点是运行时动态构建命令,不依赖静态命令列表,实时读取 Google Discovery Service 自动支持所有 Workspace API(Drive、Gmail、Calendar、Sheets 等),Google 新增端点无需更新即
HY-WU – 腾讯混元开源的功能性神经记忆框架
HY-WU(混元无相)是腾讯混元推出的功能性神经记忆框架,能让AI在推理时实时生成个性化参数。框架通过Transformer参数生成器,在推理时根据输入实时合成个性化LoRA权重,动态注入冻结的基模,无需微调可实现实例级适配。
Symphony – OpenAI 开源的 Agent 编排系统
Symphony 是 OpenAI 开源的 Agent 编排系统,支持将项目工作转化为隔离的自主运行任务。Symphony能监控 Linear 等看板,自动调度 Agent 完成编码、测试到合并 PR 的全流程,提供 CI 状态、代码审查、演示视频等工作证明。
GPT‑5.4 – OpenAI推出面向专业工作的旗舰AI模型
GPT-5.4是OpenAI推出的旗舰AI模型,定位为"专为专业工作设计的最强前沿模型"。模型首次将推理、编程、原生计算机操作、深度网页搜索和百万Token上下文整合进单一模型,且未牺牲任何单项性能。
HiClaw – 阿里云开源的多Agent团队协作系统
HiClaw 是阿里开源的Agent 团队协作系统,定位"Team 版 OpenClaw"。系统引入 Manager Agent 作为 AI 管家,自动协调多个 Worker Agent 完成复杂任务。
MagicAgent – 荣耀联合复旦推出的智能体基础模型
MagicAgent是荣耀联合复旦大学推出的智能体基础模型,以32B密集架构和30B-A3B MoE架构实现百亿参数内最强性能。
GPT‑5.3 Instant – OpenAI 推出的轻量级对话模型
GPT‑5.3 Instant 是 OpenAI 推出的轻量级对话模型,专为优化日常聊天体验设计。模型显著改善"爱说教、太啰嗦"的机械语气,回答更直接自然,联网搜索时整合质量更高,能结合知识图谱提供深度分析,避免简单罗列链接。
Gemini 3.1 Flash-Lite – 谷歌推出的轻量级旗舰模型
Gemini 3.1 Flash-Lite是Google推出的轻量级旗舰模型,主打极致性价比。模型以每秒363 token的输出速度、0.25美元/百万token的输入价格,在速度上碾压GPT-5 mini(快5倍),价格为Claude 4.5 Haiku的四分之一。
Fun-AudioGen-VD – 阿里通义实验室推出的音色设计模型
Fun-AudioGen-VD 是阿里通义实验室语音团队推出的创新语音大模型,定位为面向"声音设计与场景化音频生成"的专业工具。模型支持"FreeStyle"自由指令生成,能根据自然语言描述,一次性生成包含特定音色、情绪表达和完整听觉场景的高质量音频,实现"人物+场景"的一体化声音创作。
OpenSandbox – 阿里巴巴开源的通用 AI 应用沙箱平台
OpenSandbox 是阿里巴巴开源的通用 AI 应用沙箱平台,采用 Apache 2.0 协议,专为安全执行 AI 生成代码和自动化任务而设计。提供多语言 SDK(Python、Java/Kotlin、JavaScript/TypeScript)和统一沙箱 API,内置 Docker 和 Kubernetes 运行时支持,可快速部署代码解释器、浏览器自动化、桌面环境(VNC/VS Code)等
TinyClaw – TinyAGI开源的轻量级多智能体协作框架
TinyClaw 是 TinyAGI 开源的轻量级多智能体协作框架,专为资源受限环境设计。TinyClaw支持在树莓派等设备上同时运行多个专业 AI Agent(如 @coder、@writer),智能体间可通过链式执行和扇出模式协作完成任务。
OpenFang – 开源AI Agent操作系统,自动执行完整工作流
OpenFang 是用 Rust 构建的开源 Agent 操作系统,核心创新是 Hands——7 个预置的自主能力包,让 AI 无需人工触发可 7×24 小时自动执行任务(如监控竞品、挖掘客户、剪辑视频)。
AngelSlim – 腾讯混元开源的全模态大模型压缩工具包
AngelSlim 是腾讯混元团队自研并开源的全模态大模型压缩工具包,通过量化、投机采样、稀疏化和蒸馏等技术,为大语言模型(LLM)、视觉语言模型(VLM)及语音模型提供高效、易用的压缩与加速解决方案。
SkyReels V4 – 昆仑万维推出的AI多模态视频基础模型
SkyReels V4是昆仑万维推出的视频基础模型,是全球首个支持多模态输入、联合音视频生成及统一生成/修复/编辑的AI视频模型。模型采用双流MMDiT架构,可生成1080p/32FPS/15秒影院级同步音视频。
Arrow 1.0 – Quiver AI推出的SVG原生AI生成模型
Arrow 1.0 是 Quiver AI 推出全球首款 SVG 原生 AI 生成模型。与传统像素生成模型不同,模型能直接输出可缩放矢量图形代码,图像基于数学公式构建,支持无限放大而不失真。
pplx-embed – Perplexity推出的系列文本嵌入模型
pplx-embed 是 Perplexity 推出的系列文本嵌入模型,包含标准检索的 pplx-embed-v1 和上下文感知的 pplx-embed-context-v1,均提供 0.6B 和 4B 两种规模。
LocoOperator-4B – LocoreMind开源的代码探索智能体模型
LocoOperator-4B 是 LocoreMind 开源的 4B 参数代码探索智能体,基于 Qwen3-4B-Instruct 通过知识蒸馏从 Qwen3-Coder-Next 训练而来。模型定位为 Claude Code 等编程助手的本地子智能体,专门处理代码库搜索、文件读取、目录遍历等探索任务,实现零 API 成本。
粤公网安备 123456789号