YourHair – AI 在线发型设计与测试工具,多维面部分析
YourHair 是基于 AI 的在线发型设计与测试工具,用户只需上传一张正面头像,可生成包含脸型、发质、气质分析在内的专属发型报告,智能推荐 15 款发型效果图(最适合 5 款、普通推荐 5 款、不建议 5 款)。
实测 Awesome-design-md – 精准复刻知名产品网页风格
今天发点适合做网页设计的东西。平时我们让 Cursor、Claude Code、Codex、这些Agent 做页面,经常会遇到一个问题:跟 AI 说了想要复刻什么风格的页面,但是复刻出来总是只有一点点相似,根本不符合我们的预想。今天就给大家推荐一个GitHub上的项目叫:Awesome-design-md,专门用来复刻知名产品的网页风格。
Claude Science – Anthropic推出的 AI 科研工作台
Claude Science是Anthropic推出的AI科研工作台,定位为科学家的AI工作平台。平台基于Claude Opus 4.8的科研专用环境,将文献检索、数据分析、代码执行、图表生成和论文撰写整合到单一界面。
Yeri AI – AI 全能在线创作平台,覆盖完整内容生产流程
Yeri AI 是 AI 图片生成、AI 视频生成、照片特效与创意编辑于一体的全能型在线创作平台。整合了文生图、图生图、文生视频、图生视频、AI 图片编辑器、背景移除、扩图、图片放大及多种照片特效模板,让用户无需在多个工具之间切换,能在同一个工作区内完成从灵感构思到成品输出的完整内容生产流程。
Wan-Streamer – 阿里开源的实时全双工多模态基础模型
Wan-Streamer 是阿里达摩院开源的端到端实时全双工多模态基础模型,通过统一因果 Transformer 架构将文本、音频、视频的输入输出 token 整合为同一条因果序列,实现亚秒级实时双向视频交互,模型响应延迟仅 200ms。
LongCat-2.0 – 美团开源的新一代万亿参数语言模型
LongCat-2.0 是美团开源的大规模 MoE 语言模型,拥有 1.6 万亿总参数,每 token 激活约 480 亿,基于 AI ASIC 超算集群完成训练与部署。
WorkRally – 腾讯视频推出的工业级AI漫剧制作平台
WorkRally 是腾讯视频推出的首款面向精品漫剧制作的工业级AI平台,面向2D/3D动漫及AI仿真人剧等内容,覆盖从剧本解析、分镜生成、内容生产到资产管理与团队协作的完整生产链路,为创作者提供一体化精品漫剧生产系统。
yuxinlu1 Gemma4-12B – 开源的编程与 Agentic 模型系列
yuxinlu1 Gemma4-12B 是个人开发者逯雨基于 Google Gemma 4 12B 指令模型微调的开源编程与 Agentic 模型系列,包含 V1 代码版和 V2 Agentic 版 。
RedKnot – 小红书开源的长文本推理加速引擎
RedKnot 是小红书开源的长文本 LLM 推理加速引擎,将 KV Cache 按注意力头维度解耦,离线分类为需全局重算的全局头与可局部复用的局部头,配合 SegPagedAttention 实现按头分页存储与融合变长注意力内核,避免 attn_mask 带来的内核惩罚。
虎牙VAM 1.0 – 虎牙推出的实时多模态数字人基础模型
虎牙VAM 1.0(Vivid Avatar Model)是虎牙推出的基于DiT架构的实时多模态数字人基础模型,一张照片可生成能说话、能唱歌跳舞的AI数字人。
T:0 – Airwallex 推出的 AI-native 自主财务平台
T:0 是 Airwallex 推出的 AI-native 自主财务平台,通过 Accountant、Tax Preparer、Integrator、Scout、CFO 五大智能体协作,从企业成立 Day 0 起端到端自动化记账、税务、合规、预测与财报。
Nano Banana 2 Lite – 谷歌推出的轻量级 AI 图像生成模型
Nano Banana 2 Lite 是谷歌推出的自研轻量级 AI 图像生成模型,定位速度优先的极速版,可在 4 秒内生成单张图像,每千张收费仅 0.034 美元。
LocateAnything – 英伟达推出的视觉语言定位模型
LocateAnything是英伟达推出的视觉语言定位模型,基于并行框解码技术,用户输入自然语言即可在图像中精准框选目标。模型支持多目标检测、GUI定位、OCR文本检测和点级指向等任务,推理速度达12.7 BPS(H100)。
Claude Sonnet 5 – Anthropic推出的最强智能体模型
Claude Sonnet 5是Anthropic推出的 Sonnet 系列中智能体能力最强的模型,支持制定计划、调用浏览器和终端等工具并自主运行。
TanStarter – AI 全栈框架,包含完整生产级 SaaS 基础
TanStarter 是基于 TanStack Start 全栈框架和 Cloudflare 边缘网络构建的 SaaS 启动模板,专为独立开发者和小团队设计。内置了完整的用户系统、支付(订阅/一次性)、数据库、文件存储、邮件、Newsletter、博客、后台管理和 AI 能力(文本、对话、生图、图片编辑),预置了定价页、关于页、联系页等常用页面。
FastContext -微软开源的轻量级代码仓库探索模型
FastContext 是微软开源的轻量级代码仓库探索模型,专为编程 Agent 设计。模型将仓库浏览与任务求解解耦,主 Agent 通过自然语言查询委托 FastContext 执行只读探索,后者并行调用 Read/Glob/Grep 工具,最终用紧凑的文件路径与行号引用()返回聚焦证据。
Krea 2 – Krea AI 推出首个从零训练的基础图像生成模型
Krea 2 是 Krea AI 推出的首个从零训练的基础图像生成模型,定位为"美学优先"的创意协作者。专注于视觉美学一致性、风格迁移和创意控制,而非单纯的提示词精确翻译。模型开源两个版本:RAW(未蒸馏基础模型,可塑性极强,适合训练 LoRA)和 Turbo(8步蒸馏模型,约2秒出图,支持 1K~2K 分辨率)。
HTML Anything – nexu-io 团队开源的 HTML 编辑器
HTML Anything 是 nexu-io 团队开源的 Agent 时代 HTML 编辑器,内置 75 套 Skill 模板覆盖杂志、演示、海报、小红书卡片等 9 种交付形态,可自动识别本地 18 种 Code Agent CLI 并复用已登录会话。
DSpark – DeepSeek 联合北京大学开源的推测解码加速框架
DSpark 是 DeepSeek 联合北京大学开源的推测解码加速框架,专门解决大模型自回归生成速度慢、像"挤牙膏"的痛点。采用半自回归生成架构,通过轻量级 Markov 头建模 token 间依赖,兼顾并行草稿的速度与连贯性;同时引入置信度调度验证,根据系统负载动态分配验证资源。
用箭头标注精准修改 AI 图片,Cowart 项目已获 2k+ Stars
今天发点适合做图片的东西。平时用 AI 生图,喜欢的风格可以搜,提示词也有现成参考,效果不满意就多生成几次。真正麻烦的是,成图已经有八九分满意,偏偏还有几个细节要改。和 AI 沟通时,既说不清具体位置,AI 也找不准修改对象,聊了好几轮,改错的地方反而越来越多。现在这个问题有办法绕过去了。GitHub 上的 Cowart 项目,直接把无限画布搬进了 Codex。
粤公网安备 123456789号