以下是过去半天AI领域论坛帖子内容的总结:
模型与工具进展:
- 华为开源盘古模型: 华为开源了所有盘古模型,包括最大规模的718B,以及两个7B和1B的小模型。
- 阿里巴巴开源 Qwen-Image: 阿里发布了首个图像生成基础模型 Qwen-Image,拥有 20B 参数,擅长文本渲染和复杂场景生成。
- 腾讯开源混元轻量级大模型: 腾讯混元团队开源了 0.5B 到 7B 四款小尺寸大语言模型,针对低功耗场景优化。
- XAI 发布 Grok Imagine 4: 马斯克旗下 XAI 推出的 Grok Imagine 4 支持文生图/视频及 NSFW 内容生成。
- 数字人工具包分享: 有用户分享了免费的数字人工具包,包含程序包、指令文本、数字人声音文件和安装使用教程。
- 轻量级短链服务 Zurl 开源: 用户使用 FastAPI+SQLite3+Redis 开发了一个轻量级的短链系统 Zurl 并开源。
- Cap-Worker 验证码后端开源: 基于 Cloudflare Workers 构建的 Cap PoW 网站验证码后端正式开源,全球加速、高可用,且免费使用。
- Memos 应用 Meow 新增 AI 功能: 类似于 Memos 的便签应用 Meow 增加了 AI 轻度集成功能,并支持分享图生成。
- IT 资讯领航员 Prompt: 有用户分享了使用 gemini 2.5 pro + claude 4 sonnet 打造的“IT资讯领航员”提示词,可以生成高质量的资讯简报。
- 浏览器资源嗅探扩展: 有用户分享了一款名为 cat-catch 的浏览器资源嗅探扩展,可以帮助筛选列出当前页面的资源,提供嗅探缓存捕捉视频录制等各种工具抓取资源。
- AI旅行规划师: 有开发者上线了一款AI超级智能体《当贝AI旅行规划师》,可以DIY个性化定制旅行路线,一键生成。
- CNB 管理平台: 开发者利用AI写了一个uTools插件,可以方便快捷地管理CNB相关的资源。
使用体验与问题:
- Gemini 体验讨论: 有用户分享了 Gemini、Claude 和 GPT 的实际使用体验,认为 Gemini 在可靠性和判断力方面表现更好。
- Gemini 回复过于积极: 有用户反映 Gemini 在 Studio 中回复过于积极向上,对所有反馈都表示重要。
- Claude Code 使用问题:
- 有用户分享了在 Windows 安装 Claude Code 的教程。
- 有用户在使用GLM 4.5 配合claude code时感觉速度很慢,寻求替代方案。
- 有用户遇到 SSH 登录 Claude Code 失效的问题,提示缺少 API Key。
- 有用户反映自建的 newapi 中转 GLM4.5 不计费。
- Claude Pro 账号分享与抽奖: 有用户分享了即将到期的 Claude Max Cookie,同时也有用户举办 Claude Pro 账号的抽奖活动。
- Cursor edu 账号购买风险: 有用户分享了在某鱼购买 Cursor edu 账号被套路的经历,提醒注意风险。
- Gemini API 计费问题: 有用户咨询如何设置 Gemini API 的计费,以贴近 20w 以上 tokens 的真实用量。
- ChatGPT 画图能力: 有用户觉得 ChatGPT 画图能力较弱,听不懂指令,修改效果差。
- ChatGPT 地区限制: 有用户反映 ChatGPT 提示所在地区不支持,无法使用。
- 关于国内版本 gpt4o-image 的讨论: 有用户发现国内版本的 gpt4o-image 已经开源,并上架 fal.ai。
- kilocode 运行自动化问题: 有用户咨询 kilocode 的运行命令如何自动化,避免每次手动点击。
其他讨论:
- AI 岗位机会: 有用户询问大模型应用开发领域的市场行情、岗位机会和技术门槛。
- AI 时代危机感: 有用户分享了老板的发言,表达了对 AI 时代可能带来的职业危机的担忧。
- 后端转行语言选择: 有用户咨询从土木转行后端开发,应该选择 Java 还是 Python。
- 页面元素依赖识别: 有开发者提问主流 Code Agent 如何实现代码间依赖识别,以实现页面元素的精准修改。
- 公司搭建梯子方案: 有用户咨询公司内部搭建梯子的方案,主要用于使用国外 AI 服务。
希望以上总结对您有所帮助!