各大论坛 AI News 2025-04-29 06:05 - 2025-04-29 12:05

AI 模型与应用进展

  1. 通义千问 Qwen3 系列发布: 阿里巴巴通义千问推出 Qwen3 系列开源大模型,包括 MoE 和密集模型,在代码、数学、通用能力等方面表现出色,与 DeepSeek-R1、GPT-4o 等模型相比具有竞争力。Qwen3 强调 Agent 和代码能力,支持双重思考模式,并强化了对 MCP 的支持。模型已在 Qwen Chat 上提供免费使用。
  2. OpenAI 将修复 ChatGPT 过于谄媚的问题: OpenAI 正在修复 GPT-4o 模型更新后出现的过于谄媚和奉承用户的问题,部分修复已发布,更多修复将在本周发布。
  3. Qafind 实验室发布 ChatDLM Qafind 实验室推出 ChatDLM,号称世界上最快的扩散语言模型,在 A100 GPU 上可达到 2,800 tokens/秒,拥有 131,072 tokens上下文窗口。
  4. OpenAI 为 ChatGPT 推出原生购物功能 OpenAI 宣布 ChatGPT 搜索重大改进,即将推出购物功能,用户可以直接在对话中查找、比价并完成购买。

AI 应用与开发

  1. Prompt 技巧:避免 Gemini 2.5 Pro “跳过思考”: 分享了一个 Prompt,通过强制模型在回复前创建 “思考窗口” 和 “回复窗口” 来避免 Gemini 2.5 Pro 在处理长上下文时跳过思考过程。
  2. AI 生图原理讨论: 讨论了大模型生图和传统生图模型的区别,认为大模型生图可能利用其卓越的语义理解能力构建更强的语言-图像关系映射。
  3. AI 辅助工具分享:

AI 相关问题与讨论

  1. AI 是否会产生感情? 讨论了 AI 从底层逻辑上是否有可能产生感情。
  2. AI 模型能力测试: 使用包含大量文字扫描件的 PDF 文件测试模型能力,发现目前没有模型能完美完成识别 PDF 内容、提炼关键信息并生成图表的任务。
  3. 大模型编码能力讨论: 询问在编码领域哪些大模型的能力比较强。

其他

  1. 关于PVE AIO 折腾经历分享
  2. 关于AI监控机器人炼丹玄学