AI框架
Elephant – 蚂蚁Inclusion AI团队推出的大语言模型
Elephant(大象)是蚂蚁集团 Inclusion AI 团队研发的 100B 参数大语言模型,支持 256K 超长上下文与 32K 输出长度,在同等规模模型中达到 SOTA 性能。
Qwen3.6-Max-Preview – 阿里通义推出的下一代旗舰模型
Qwen3.6-Max-Preview 是阿里通义千问团队推出的下一代旗舰大模型早期预览版。相比 Qwen3.6-Plus,模型在智能体编程、世界知识和指令遵循三大维度实现显著提升,在 SWE-bench Pro、Terminal-Bench 2.0、SciCode 等六项编程基准测试中取得最高分。
天禧AI Claw – 联想推出的 AI 智能体助理
天禧AI Claw是联想基于OpenClaw架构推出的开箱即用型AI智能体助理,采用端云混合部署模式,支持PC、Phone、Pad多端无缝协同。工具无需本地环境配置即可7×24小时持续执行任务,设备关闭后云端仍继续运行。
GPT-Rosalind – OpenAI 推出的生命科学专用推理模型
GPT-Rosalind是OpenAI推出的生命科学专用推理模型,用DNA双螺旋结构发现者罗莎琳德·富兰克林命名。模型针对50种生物学工作流深度调优,具备假设生成、实验设计和证据合成能力,可整合50余个科学数据库,在RNA功能预测等任务中超越95%人类专家。
HappyOyster – 阿里推出的开放式世界模型产品
HappyOyster是阿里ATH创新事业部推出的开放式世界模型产品,定位为可实时构建与交互的AI生成式体验平台。产品基于世界模型技术,支持无限延展的实时内容生成,官网开放了两种玩法Directing与Wandering,让用户与AI生成的动态世界进行交互。
StepAudio 2.5 TTS – 阶跃星辰推出的语境感知语音生成模型
StepAudio 2.5 TTS是阶跃星辰推出的Contextual TTS(语境感知语音合成模型),首次将语境理解能力引入语音生成全流程。
Relax – 小红书开源的大模型强化学习训练引擎
Relax 是小红书AI平台团队开源的面向全模态与 Agentic 场景设计的大模型强化学习训练引擎。基于 Megatron-LM 与 SGLang 构建,采用服务化容错架构(Ray Serve)与 TransferQueue 异步数据总线,实现 Rollout、Actor、Critic 角色完全解耦。
Gemini 3.1 Flash TTS – 谷歌推出的文本转语音模型
Gemini 3.1 Flash TTS是Google推出的新一代文本转语音模型,提供更强的可控性、表现力和音质。模型支持70多种语言,引入音频标签技术,可通过自然语言指令精确控制声音风格、语速和表达方式。
混元3D世界模型 2.0 – 腾讯混元开源的多模态世界模型
混元3D世界模型 2.0(HY-World 2.0)是腾讯混元推出的开源多模态世界模型,支持从文本、单图、多视图或视频生成可漫游的3D高斯溅射(3DGS)场景。模型采用四阶段架构,全景生成→轨迹规划→世界扩展→3D重建,实现"文/图生3D世界"与"视频重建3D世界"的统一。
MAI-Image-2-Efficient – 微软推出的轻量版文生图模型
MAI-Image-2-Efficient是微软推出的自研文生图模型,为MAI-Image-2的轻量高效版本,主打高性价比商业量产,在保持照片级真实图像质量的同时,实现成本降低41%、生成速度提升22%、GPU效率提升4倍。
SearchClaw – 中国人民大学推出的 AI 深度研究智能体
SearchClaw 是 RUC-NLPIR(中国人民大学信息检索实验室)推出的自托管式 AI 深度研究智能体,配备 Web 交互界面。用户提交问题后,系统自动执行多轮网络搜索、页面抓取、论文检索与内容综合,最终生成带引用链接的详实报告。
Spark 2.0 – World Labs 开源的Web端 3D 高斯溅射渲染引擎
Spark 2.0是World Labs(李飞飞创立)开源的Web端3D高斯溅射渲染引擎,基于Three.js和WebGL2构建。Spark 2.0首创LoD细节层次系统、渐进式流式传输与虚拟内存技术,可在桌面、手机、VR等任意设备浏览器中实时渲染超1亿个splats的大规模3D世界。
OpenHarness – 港大开源的轻量级 AI Agent 框架
OpenHarness 是香港大学数据智能实验室(HKUDS)开源的轻量级 AI Agent 框架,用纯 Python 实现,仅 11,733 行代码(为 Claude Code 的 1/44 体积),复刻了其 98% 的核心工具能力(43 个工具)和 61% 的命令集(54 个命令)。
OmniWeaving – 腾讯混元联合浙大等开源的视频生成框架
OmniWeaving是浙江大学联合腾讯混元、南洋理工大学推出的统一视频生成框架。框架突破传统开源模型单一任务限制,实现多模态自由组合与推理增强生成,能将交错图文视频时序绑定生成连贯内容,像"智能导演"主动推断复杂意图。
InternSVG – 上海AI Lab推出的统一 SVG 建模套件
InternSVG是上海人工智能实验室等推出的面向统一SVG建模的“数据-评测-模型”综合套件,包含三大组件:超1600万样本的SAgoge数据集、标准化SArena评测基准,以及基于InternVL3-8B的统一多模态大模型。
JoyAI-Image-Edit – 京东开源的指令引导图像编辑模型
JoyAI-Image-Edit是京东开源的指令引导图像编辑模型,基于JoyAI-Image多模态基础模型构建。模型支持通过自然语言指令实现精确可控的空间操作与智能图像修改,具备多模态理解能力,可精准解析文本指令并对图像局部或整体进行编辑。
Qwen3.6-Plus – 阿里通义推出的原生视觉语言模型
Qwen3.6-Plus是阿里通义实验室推出的全新原生视觉语言模型,主打编码智能体能力跃升。模型默认支持100万token超长上下文,在SWE-bench、Terminal-Bench等代码修复与终端自动化基准测试中领先国内同尺寸模型。
Wan2.7-Image – 阿里通义推出的 AI 图像生成与编辑模型
Wan2.7-Image是通义实验室推出的AI图像生成与编辑模型,支持深度自定义人物形象(脸型、眼型、骨相等),告别千篇一律的「AI标准脸」,可精准生成4000+字符及中文简繁体、英日韩德法等多种语言内容,告别乱码困扰。
TeamClaw – AI Agent管理平台,智能拆解任务、分派协作
TeamClaw 是AI 员工团队管理平台,定位"一个人的 AI 办公室"。平台能让用户像招聘真实员工一样定义 AI 岗位(CEO、分析师等),角色秒级到岗;支持为 AI 安装专业技能,自动拆解任务并分派协作;可连接数据库、飞书、钉钉等业务系统,让 AI 真正落地到实际工作流。
Lightpanda – 开源的 AI 浏览器,兼容主流自动化框架
Lightpanda 是专为 AI Agent 和自动化设计的开源无头浏览器,用 Zig 语言从零编写,不依赖 Chromium 或 WebKit。工具内存占用仅为 Chrome 的 1/16,执行速度快 9 倍,支持 JavaScript 执行并通过 CDP 协议兼容 Playwright、Puppeteer 等主流自动化框架。
粤公网安备 123456789号