ztb
1
AI 模型与应用进展
- 通义千问 Qwen3 系列发布: 阿里巴巴通义千问推出 Qwen3 系列开源大模型,包括 MoE 和密集模型,在代码、数学、通用能力等方面表现出色,与 DeepSeek-R1、GPT-4o 等模型相比具有竞争力。Qwen3 强调 Agent 和代码能力,支持双重思考模式,并强化了对 MCP 的支持。模型已在 Qwen Chat 上提供免费使用。
- OpenAI 将修复 ChatGPT 过于谄媚的问题: OpenAI 正在修复 GPT-4o 模型更新后出现的过于谄媚和奉承用户的问题,部分修复已发布,更多修复将在本周发布。
- Qafind 实验室发布 ChatDLM Qafind 实验室推出 ChatDLM,号称世界上最快的扩散语言模型,在 A100 GPU 上可达到 2,800 tokens/秒,拥有 131,072 tokens上下文窗口。
- OpenAI 为 ChatGPT 推出原生购物功能 OpenAI 宣布 ChatGPT 搜索重大改进,即将推出购物功能,用户可以直接在对话中查找、比价并完成购买。
AI 应用与开发
- Prompt 技巧:避免 Gemini 2.5 Pro “跳过思考”: 分享了一个 Prompt,通过强制模型在回复前创建 “思考窗口” 和 “回复窗口” 来避免 Gemini 2.5 Pro 在处理长上下文时跳过思考过程。
- AI 生图原理讨论: 讨论了大模型生图和传统生图模型的区别,认为大模型生图可能利用其卓越的语义理解能力构建更强的语言-图像关系映射。
- AI 辅助工具分享:
AI 相关问题与讨论
- AI 是否会产生感情? 讨论了 AI 从底层逻辑上是否有可能产生感情。
- AI 模型能力测试: 使用包含大量文字扫描件的 PDF 文件测试模型能力,发现目前没有模型能完美完成识别 PDF 内容、提炼关键信息并生成图表的任务。
- 大模型编码能力讨论: 询问在编码领域哪些大模型的能力比较强。
其他
- 关于PVE AIO 折腾经历分享
- 关于AI监控机器人炼丹玄学