NatAgent – AI数据情报监控与分析平台
NatAgent 是基于自然语言的 AI 数据情报监控与分析平台,专注于通过智能化技术帮助用户高效提取、监控和分析各类网络数据,从中获取可操作的洞察。核心功能包括智能监控,实时追踪网页、社交媒体、电商平台等内容变化并推送警报
CodeMender – DeepMind推出的代码修复AI Agent
CodeMender是DeepMind推出的是基于 Gemini Deep Think 模型的 AI 代理工具,专注于自动识别和修复软件中的关键安全漏洞。采用被动响应与主动防御相结合的方式,能立即修补新发现的漏洞,能重写和保护现有代码以消除系统性漏洞。
Juicebox – AI招聘平台,精准匹配岗位需求
Juicebox 是领先的AI招聘平台,通过AI技术优化招聘流程。平台能从海量数据中自动筛选出符合条件的候选人,通过智能算法精准匹配岗位需求。
Mew Design – AI设计工具,自然语言生成视觉设计作品
Mew Design是创新的AI设计工具,用户通过自然语言描述能快速生成专业的视觉设计作品。工具支持多种设计类型,如社交媒体帖子、海报、传单等,满足个人和企业的多元需求。
SceneGen – 上海交大推出的3D场景生成框架
SceneGen是上海交通大学研究团队开发的高效开源3D场景生成框架。能从单张场景图像及其对应的物体分割掩码出发,通过一次前向传播,直接生成包含完整几何结构、纹理和空间布局的3D场景。创新之处在于端到端的生成流程,无需依赖耗时的优化过程或从资产库中检索组装,显著提升了生成效率。
Code2Video – 国立大学推出的AI教学视频生成框架
Code2Video是新加坡国立大学Show Lab团队开发的AI教学视频生成框架,通过Python代码自动生成高质量教育视频。核心创新在于采用三智能体协作模式:Planner负责将知识点转化为结构化故事板,Coder将故事板转为可执行Manim代码,Critic优化视觉布局。
Auralix – AI学习工具,语音互动讲解笔记内容
Auralix 是创新的 AI 语音辅导工具,通过实时语音互动帮助用户高效学习。工具支持将学习材料转化为清晰的笔记,通过 AI 教练进行一对一的语音辅导,支持打断提问、即时反馈和个性化测验。
UntitledPen – AI语音生成平台,自由选择定制声音
UntitledPen 是AI语音生成平台,能将文字快速转换为自然流畅的语音,支持多种语言和语音风格,提供智能写作、语音定制、音频编辑等功能。
Ming-UniAudio – 蚂蚁集团开源的音频多模态模型
Ming-UniAudio 是蚂蚁集团开源的音频多模态模型,统一语音理解、生成和编辑任务。核心是 MingTok-Audio,一个基于 VAE 框架和因果 Transformer 架构的连续语音分词器,能有效整合语义和声学特征。基于此,Ming-UniAudio 开发了一个端到端的语音语言模型,平衡了生成和理解能力,并通过扩散头确保高质量的语音合成。
Agent Kit – OpenAI推出的AI Agent开发工具
Agent Kit 是 OpenAI 推出的一套完整的智能体开发工具包,帮助开发者将 AI 代理从原型快速推进至生产环境。包含三大核心组件:Agent Builder可视化画布工具,支持拖拽节点设计复杂工作流,无需从零编写代码
TextWell – AI写作辅助工具,从不同角度进行优化
TextWell是AI写作辅助工具,能提升文档质量与吸引力,通过模拟AI评审团,从不同角度对文档进行批评和建议,帮助用户优化内容。
OpenLens AI – 清华推出的医学研究AI助手
OpenLens AI 是清华大学自动化系推出的专为医学研究设计的全自主人工智能研究助手,通过多智能体协作,实现从文献综述、实验设计、数据分析到论文生成的全流程自动化,极大提升医学研究效率,将科研周期从“月级”缩短至“小时级”。
ReceiptHero – 开源AI记账工具,拍照生成数字化账单
ReceiptHero 是开源的 AI 记账工具,能通过拍照将收据快速转化为数字化账单。工具基于先进的 AI 图像识别技术,用高达 95% 的准确率提取收据上的日期、金额、商户名称等关键信息,支持自动对支出进行智能分类,如餐饮、交通等。
Tinker API – Thinking Machines Lab推出的模型微调API
Tinker API 是 Thinking Machines Lab 发布的首款产品,专为语言模型微调而设计。简化语言模型的微调流程,让研究人员和开发者能专注于算法和数据,无需担心复杂的分布式训练基础设施。提供底层操作原语,如forward_backward和sample,让开发者能构建自定义微调或强化学习算法,支持从小到大的各类开放权重模型,切换模型仅需修改代码中的一个字符串。
LONGLIVE – 英伟达等推出的交互式长视频生成框架
LONGLIVE 是英伟达等顶尖机构联合推出的实时交互式长视频生成框架。框架通过帧级自回归(AR)模型,结合 KV-recache 机制、流式长视频微调和短窗口注意力 + 帧汇入技术,解决长视频生成中效率和质量的双重瓶颈。
怎么用飞书多维表格做自媒体内容工作流?一文看懂
如果让我只推荐一个真能让大多数人省事的工具,我会毫不犹豫说:飞书多维表格。这不是我一个人的偏爱。我身边不少做AI内容的朋友都在用,甚至像 DeepSeek、Kimi、MiniMax、阶跃这些大厂团队,也都把飞书多维表格当成日常的效率中枢。那这篇文章,我就来聊聊:飞书多维表格到底好用在哪,为什么一旦开始用就停不下来。
通义万相Wan2.5模型实测,可生成音画同步视频
2025云栖大会终于来啦!今年的主题是“云智一体•硅碳共生”,全球50多个国家的2000多位演讲嘉宾齐聚杭州,围绕Agentic AI与Physical AI等前沿话题展开对话,场面堪称一场科技春晚。今天上午倍受关注的还是阿里最新的大模型——通义万相 Wan2.5-Preview 系列模型。
Manus开源平替,AiPy本地部署免费用L5级Agent
直到最近,我发现了一个“本地版Manus”——AiPy,国内就可以直接免费用。不同的是,Manus 只能通过虚拟浏览器执行任务,比如发邮件、填写网页表单。而 AiPy 则是 L5 级 Agent,它不仅能理解你的目标,还能自己拆解步骤,用 Python 写代码,执行任务,再在出错时自我修正。整个过程中,你完全不用插手。
腾讯推出《企业级智能体产业落地研究报告》(PDF文件)
《企业级智能体产业落地研究报告》是腾讯云、腾讯研究院联合国际权威研究机构Gartner共同推出的,报告深入探讨企业级智能体的产业落地情况。
横评Kimi OK Computer、Manus、Lovable:厂商型Agent与第三方有何不同?
前几天,Kimi 静悄悄发了条推文,官宣 Kimi Agent 模式「OK Computer」开始小规模灰度测试。这次Kimi对它的定位是全栈白领,能搜索、规划、调用工具,用户负责提出想法,OK Computer负责产出报告、PPT、APP和网页。
粤公网安备 123456789号