AI项目
Fun-CosyVoice3.5 – 阿里通义实验室推出的语音生成模型
Fun-CosyVoice3.5 是阿里通义实验室语音团队最新发布的语音生成模型,主打多语种音色复刻与精细化表达控制。模型最突出的创新在于FreeStyle自然语言控制能力——用户无需掌握专业参数,直接用口语化指令如"语气坚定一点""语速慢一点"即可精准调控语音效果,实现"一句话自由生成语音"。
FireRed-OCR – 小红书开源的轻量级文档结构解析视觉语言模型
FireRed-OCR 是小红书团队开源的轻量级文档结构解析视觉语言模型,以仅 2B 参数的规模在 OmniDocBench v1.5 权威评测中斩获 92.94% 综合得分,超越 GPT-5.2、Gemini-3.0 Pro 及 Qwen3-VL-235B 等超大模型,实现了"小模型击败大模型"的突破。
Epismo – AI工作流管理与协作平台,支持AI技能封装
Epismo 是 AI 工作流管理与协作平台,致力于将零散的 AI 操作经验转化为标准化的"技能"单元。平台支持 Gemini、Claude、ChatGPT 等多种 AI Agent 协同工作,用户可通过自然语言指派任务、智能拆解目标,在可视化看板中管理人机混合团队。
theORQL – 前端AI编程工具,支持自动复现与修复闭环
theORQL 是具备视觉感知能力的前端 AI 编程工具。工具打通了 Chrome DevTools 与 VS Code/Cursor,实现运行时全景感知,能捕获 DOM、CSS、网络请求和 Console 日志,精准映射 UI 元素到源码。
Goose – 开源本地AI Agent框架,自主执行完整开发
Goose 是 Block 开源的本地 AI Agent 框架,能自主执行完整工程任务——读文件、写代码、跑测试、调 API、自动 Debug,出错后自我修正直至完成。
DataClaw – 开源AI对话数据导出工具,一键转为标准训练集
DataClaw 是开发者Peter O'Malle开源的AI对话数据导出工具。能自动抓取用户与Claude Code、Codex CLI、Gemini CLI等AI编程助手的完整对话历史,将其转换为结构化的JSONL训练数据集,支持一键发布到Hugging Face平台供社区使用。
MeowTXT – AI音视频转文字工具,智能说话人识别
MeowTXT 是在线 AI 音视频转文字工具,主打极速、精准的转录体验。用户只需拖拽上传 MP3、MP4、WAV 等文件,或直接粘贴 YouTube 链接,可在数分钟内获得文字稿。其 AI 引擎以 40 倍实时速度处理内容,准确率高达 97.5%,新用户可免费体验前 10 分钟。
Transcript LOL – AI音视频转录工具,智能区分说话人
Transcript LOL 是面向专业人士的 AI 音视频转录工具,已服务全球 10 万+用户。基于 OpenAI Whisper 技术,可在数秒内将音频或视频高精度转为文字,支持 70+ 语言、单次长达 10 小时的文件处理。
水产市场 – AI Agent能力进化平台,涵盖多种实用技能
水产市场(Seafood Market)是为 OpenClaw 构建的 AI Agent 生态平台。平台汇聚了 700+ 技能资产,涵盖 SEO 优化、PPT 生成、周报撰写、多源新闻聚合等实用能力,Agent 可通过一行命令自主安装学习。
OpenMusic AI – AI音乐生成平台,一站式完成从创作到发行
OpenMusic AI 是一站式 AI 音乐生成平台,专为 YouTube、Spotify 和 TikTok 等主流平台创作免版税音乐而设计。用户只需描述想要的音乐风格、选择情绪,AI 可在 60 秒内生成最长 8 分钟的完整歌曲,可直接用于商业发布。
万镜一刻 – 阿里云推出的AI视频创作工具
万镜一刻是阿里云推出的AI视频创作工具,以"万镜生辉·一刻成片"为核心理念,为不同需求的创作者提供从内容解析到故事板生成的一站式解决方案。产品目前处于内测阶段,核心功能包括故事板创作、主体创作、在线剪辑和资产管理四大模块,覆盖从剧本生成到后期处理的全流程闭环。
华为云码道 – 华为云推出的AI编程工具
华为云码道(CodeArts)是华为云推出的AI编程工具,深度融合IDE、自主开发模式与代码大模型,支持GLM-5.0、DeepSeek-V3.2及鸿蒙专属模型,提供项目级代码生成、智能续写、单元测试生成等功能。
Imagine – AI全栈应用开发工具,自然语言生成完整应用
Imagine 是 AI 全栈应用开发工具,能直接生成包含后端、数据库、身份验证的生产级应用。用户无需繁琐的环境配置,通过自然语言描述可快速构建 SaaS 平台、CRM 仪表盘、游戏或着陆页等产品。
MoodMax – 一站式AI漫剧创作平台,自动拆解分镜脚本
MoodMax 是一站式AI漫剧创作平台,是为创作者和工作室打造工业级漫剧生产工作台。用户无需绘画基础,通过智能剧本创作、自动分镜拆解、短片合成三步即可完成专业漫剧制作。
Ctrl-World – 清华联合斯坦福推出的具身世界模型
Ctrl-World 是清华陈建宇与斯坦福 Chelsea Finn 团队联合推出的具身世界模型,在 WorldArena 权威评测中斩获具身任务能力全球第一、视频生成质量全球第二。
Talksign-1 – Talksign推出的AI实时美式手语翻译模型
Talksign-1是专为美式手语(ASL)设计的AI实时翻译模型,支持双向转换,能通过摄像头捕捉3D人体关键点识别250个ASL词汇,或将语音/文字转为手语视频。
KiloClaw – Kilo code推出OpenClaw的全托管云服务
KiloClaw 是Kilo code推出的OpenClaw的全托管云服务。OpenClaw 支持 50 余种聊天平台、执行系统命令、操控浏览器,自行部署需 30-60 分钟配置且维护繁琐。
Perplexity Computer – Perplexity推出的通用数字员工
Perplexity Computer 是 Perplexity 推出的基于浏览器的、全能型通用数字员工,能自主拆解复杂任务,调度19个顶尖AI模型并行协作,如Claude负责推理、Gemini专攻研究、Grok追求速度。
MaxClaw – MiniMax推出的OpenClaw一键云端部署方案
MaxClaw是MiniMax Agent平台推出的OpenClaw一键云端部署方案,用户无需配置服务器,10秒内可完成部署,零技术门槛、零维护负担。
牛马AI – 本地AI个人工作台,自由接入多种模型
牛马AI是本地化AI个人生产力客户端,主打"让AI当牛做马"的人机协同理念。工具支持完全离线运行,可自由接入OpenRouter、Kimi、DeepSeek等多种API及本地模型,内置"牛马棚"技能市场,提供文档解析、数据分析、内容创作等自动化任务编排。
粤公网安备 123456789号