AI 模型与应用进展
1. 多家公司发布/更新 AI 模型及工具:
- Google Gemini 2.5: 正式发布 Gemini 2.5 Pro 和 Flash 稳定版。新版本具备原生多模态能力,扩展了视频理解能力,可以处理长达 3 小时的视频内容。Gemini 2.5 使用了一种稀疏的混合专家(MoE)架构,并改进了数据质量方法。Gemini 2.5 的一个关键进步是“思考”功能,使模型在推理时能使用更多计算资源,提升了各个领域的推理能力,显著提高了数学和编程技能。
- 海螺 AI: 发布 Hailuo 02 视频模型,支持原生 1080p 输出,并发布 Minimax Agent 测试版,开源 M1 模型性能可媲美 DeepSeek R1。
- Proactor AI: 发布全球首个自主行动型 AI 智能体。(信息来自三花AI日报)
2. AI 应用体验与讨论:
- 文生图/视频: 用户反馈豆包在文生图和视频方面表现出色,简单高效,且免费。
- API聚合: 用户询问是否有API聚合项目支持Gemini的思维链摘要显示。
- O3P: 用户对爱OAI TV之o3p的识图能力表示失望,认为其速度慢于Gemini。
- Gemini: 用户认为Gemini官网是加强版的Cherry Studio,可以通过自定义指令和上传文件来满足需求。Gemini-2.5-flash-lite模型思考速度在450Token/s以上。
3. AI 开发与学习资源:
- LangChain4J 教程: 尚硅谷阳哥LangChain4J +向量数据库+RAG 教程分享。
- AI绘画课程: AI绘画+iP课程商业精品课程分享,融合 AI 技术与绘画艺术,培养艺术 IP。
- Coze 教程: Coze从入门到实战高效创作教程分享,讲解AI工作流,从基础到案例实操。
- VSCode Agent + Sonnet 4: 作者使用 VSCode Agent + Sonnet 4 从零开始制作了一款小游戏,代码超过 5000 行,整个过程都是用提示词描述需求,然后 agent 搞定全部。
4. 其他 AI 相关讨论:
- 大模型训练: 用户咨询如何调整训练自己的大模型,例如deepseek 8b模型,加入对话训练。
- Gemini 搜索功能: 用户提问 Gemini web 端如何开启 google 搜索。
- Claude 付款方式: 用户询问除了野卡外,如何购买 Claude。
- Cursor: Cursor好像真的能顺便用max了,claude4也可以使用
5. 开源项目更新:
- OpenWebUI: OpenWebUI 二开版本发布 v0.6.15.1,支持余额管理和充值。
- OhCar: 线报软件OhCar+网站推出,提供线报和优惠信息。
6. 平台政策更新:
- Mastodon: 更新条款以禁止AI模型训练,禁止未经授权抓取用户数据。