MaxClaw部署教程 – 10秒云端搭建OpenClaw,免服务器接入钉钉飞书

最近的AI圈几乎都被这只龙虾刷屏了...OpenClaw 可以像真人一样理解指令,并自己拆解任务,自动跑完我们要求的整个工作流程,但部署门槛难倒了一大批人。我发现最近 MiniMax Agent 发布了一个云端的 OpenClaw——MaxClaw,在 Web 端点几下鼠标,10 秒钟就能部署完成,最爽的是可以接入钉钉和飞书,通过手机直接控制~

Fun-AudioGen-VD – 阿里通义实验室推出的音色设计模型

Fun-AudioGen-VD 是阿里通义实验室语音团队推出的创新语音大模型,定位为面向"声音设计与场景化音频生成"的专业工具。模型支持"FreeStyle"自由指令生成,能根据自然语言描述,一次性生成包含特定音色、情绪表达和完整听觉场景的高质量音频,实现"人物+场景"的一体化声音创作。

Fun-CosyVoice3.5 – 阿里通义实验室推出的语音生成模型

Fun-CosyVoice3.5 是阿里通义实验室语音团队最新发布的语音生成模型,主打多语种音色复刻与精细化表达控制。模型最突出的创新在于FreeStyle自然语言控制能力——用户无需掌握专业参数,直接用口语化指令如"语气坚定一点""语速慢一点"即可精准调控语音效果,实现"一句话自由生成语音"。

FireRed-OCR – 小红书开源的轻量级文档结构解析视觉语言模型

FireRed-OCR 是小红书团队开源的轻量级文档结构解析视觉语言模型,以仅 2B 参数的规模在 OmniDocBench v1.5 权威评测中斩获 92.94% 综合得分,超越 GPT-5.2、Gemini-3.0 Pro 及 Qwen3-VL-235B 等超大模型,实现了"小模型击败大模型"的突破。

Epismo – AI工作流管理与协作平台,支持AI技能封装

Epismo 是 AI 工作流管理与协作平台,致力于将零散的 AI 操作经验转化为标准化的"技能"单元。平台支持 Gemini、Claude、ChatGPT 等多种 AI Agent 协同工作,用户可通过自然语言指派任务、智能拆解目标,在可视化看板中管理人机混合团队。

theORQL – 前端AI编程工具,支持自动复现与修复闭环

theORQL 是具备视觉感知能力的前端 AI 编程工具。工具打通了 Chrome DevTools 与 VS Code/Cursor,实现运行时全景感知,能捕获 DOM、CSS、网络请求和 Console 日志,精准映射 UI 元素到源码。

Goose – 开源本地AI Agent框架,自主执行完整开发

Goose 是 Block 开源的本地 AI Agent 框架,能自主执行完整工程任务——读文件、写代码、跑测试、调 API、自动 Debug,出错后自我修正直至完成。

Nano Banana 2 实测 – 谷歌 Gemini 3.1 Flash Image 登顶 Arena 生图榜第一

Nano Banana 2 来了。昨天,谷歌推出最新图像模型 Nano Banana 2(Gemini 3.1 Flash Image),发布即空降 Arena 文生图排行榜第一!Lovart 第一时间就可以体验了,本 Pro 会员还可以免费玩 Nano Banana 2,真香了。这篇文章,就跟大家分享一下,Nano Banana 2 的一些创意玩法。昨天,谷歌推出最新图像模型 Nano Bana

OpenSandbox – 阿里巴巴开源的通用 AI 应用沙箱平台

OpenSandbox 是阿里巴巴开源的通用 AI 应用沙箱平台,采用 Apache 2.0 协议,专为安全执行 AI 生成代码和自动化任务而设计。提供多语言 SDK(Python、Java/Kotlin、JavaScript/TypeScript)和统一沙箱 API,内置 Docker 和 Kubernetes 运行时支持,可快速部署代码解释器、浏览器自动化、桌面环境(VNC/VS Code)等

DataClaw – 开源AI对话数据导出工具,一键转为标准训练集

DataClaw 是开发者Peter O'Malle开源的AI对话数据导出工具。能自动抓取用户与Claude Code、Codex CLI、Gemini CLI等AI编程助手的完整对话历史,将其转换为结构化的JSONL训练数据集,支持一键发布到Hugging Face平台供社区使用。

MeowTXT – AI音视频转文字工具,智能说话人识别

MeowTXT 是在线 AI 音视频转文字工具,主打极速、精准的转录体验。用户只需拖拽上传 MP3、MP4、WAV 等文件,或直接粘贴 YouTube 链接,可在数分钟内获得文字稿。其 AI 引擎以 40 倍实时速度处理内容,准确率高达 97.5%,新用户可免费体验前 10 分钟。

TinyClaw – TinyAGI开源的轻量级多智能体协作框架

TinyClaw 是 TinyAGI 开源的轻量级多智能体协作框架,专为资源受限环境设计。TinyClaw支持在树莓派等设备上同时运行多个专业 AI Agent(如 @coder、@writer),智能体间可通过链式执行和扇出模式协作完成任务。

OpenFang – 开源AI Agent操作系统,自动执行完整工作流

OpenFang 是用 Rust 构建的开源 Agent 操作系统,核心创新是 Hands——7 个预置的自主能力包,让 AI 无需人工触发可 7×24 小时自动执行任务(如监控竞品、挖掘客户、剪辑视频)。

Transcript LOL – AI音视频转录工具,智能区分说话人

Transcript LOL 是面向专业人士的 AI 音视频转录工具,已服务全球 10 万+用户。基于 OpenAI Whisper 技术,可在数秒内将音频或视频高精度转为文字,支持 70+ 语言、单次长达 10 小时的文件处理。

水产市场 – AI Agent能力进化平台,涵盖多种实用技能

水产市场(Seafood Market)是为 OpenClaw 构建的 AI Agent 生态平台。平台汇聚了 700+ 技能资产,涵盖 SEO 优化、PPT 生成、周报撰写、多源新闻聚合等实用能力,Agent 可通过一行命令自主安装学习。

AngelSlim – 腾讯混元开源的全模态大模型压缩工具包

AngelSlim 是腾讯混元团队自研并开源的全模态大模型压缩工具包,通过量化、投机采样、稀疏化和蒸馏等技术,为大语言模型(LLM)、视觉语言模型(VLM)及语音模型提供高效、易用的压缩与加速解决方案。

OpenMusic AI – AI音乐生成平台,一站式完成从创作到发行

OpenMusic AI 是一站式 AI 音乐生成平台,专为 YouTube、Spotify 和 TikTok 等主流平台创作免版税音乐而设计。用户只需描述想要的音乐风格、选择情绪,AI 可在 60 秒内生成最长 8 分钟的完整歌曲,可直接用于商业发布。

万镜一刻 – 阿里云推出的AI视频创作工具

万镜一刻是阿里云推出的AI视频创作工具,以"万镜生辉·一刻成片"为核心理念,为不同需求的创作者提供从内容解析到故事板生成的一站式解决方案。产品目前处于内测阶段,核心功能包括故事板创作、主体创作、在线剪辑和资产管理四大模块,覆盖从剧本生成到后期处理的全流程闭环。

SkyReels V4 – 昆仑万维推出的AI多模态视频基础模型

SkyReels V4是昆仑万维推出的视频基础模型,是全球首个支持多模态输入、联合音视频生成及统一生成/修复/编辑的AI视频模型。模型采用双流MMDiT架构,可生成1080p/32FPS/15秒影院级同步音视频。

Arrow 1.0 – Quiver AI推出的SVG原生AI生成模型

Arrow 1.0 是 Quiver AI 推出全球首款 SVG 原生 AI 生成模型。与传统像素生成模型不同,模型能直接输出可缩放矢量图形代码,图像基于数学公式构建,支持无限放大而不失真。