AI 模型与应用进展
- Google Gemini 2.5 Pro I/O 特别版发布: 谷歌发布了 Gemini 2.5 Pro 的重大升级版本,在 LMArena 和 WebDev Arena 编码排行榜上均名列前茅。该版本已在 ai.dev 中提供,可选择 Gemini 2.5 Pro Preview 05-06 使用。(linux.do, linux.do)
- Gemini 2.5 Pro 输出思考过程: Gemini 2.5 Pro preview 版本开始输出总结后的思考过程,尽管格式可能不太规范。(linux.do, linux.do)
- LTX-Video 13B 开源视频模型: LTXStudio 发布了 130 亿参数的 LTX-Video 开源视频生成模型,采用多尺度渲染技术,提升了运动轨迹与场景理解能力,支持关键帧、镜头/角色运动控制及多镜头序列生成。(linux.do)
- ACE-Step 开源音乐 AI: ACE Studio 和 StepFun 联合开发了 ACE-Step,一款基于扩散模型的开源音乐生成模型,支持 19 种语言,提供声音克隆、歌词修改、人声性别调整等多种控制能力。(linux.do)
- ComfyUI 新增付费模型 API 节点: ComfyUI 新增了多个付费模型的 API 节点支持,定价与各模型官方 API 价格一致,未来版本将支持用户使用自己的 API key。(linux.do)
AI 工具与资源
- ATrans: 一款 AI 翻译工具,体验类似 Grok app,支持左右滑动切换不同动作,自动检测翻译,兼容 OpenAI API,支持 TTS。由于中国区政策原因,无法上架国区 App Store,开发者提供了兑换码。(v2ex)
- AI Agent 导航站: 一个收录最新 AI Agent 产品的导航站。(v2ex)
- Gemini API Key 抽奖: 有用户分享了使用 Gemini 2.5Pro 进行总结的资讯站,并提供 Gemini API Key 抽奖。(v2ex)
- n8n 工作流模板: 有开发者分享了自己通过官方审核并上传到 n8n 官方模板社区的 workflow。(linux.do)
招聘信息
- 高级全栈 AI 工程师: 招聘信息,base 日本,要求 10 年以上开发经验,有完整的 LLM 应用落地经验,提供行业顶配薪资和期权。(v2ex)