以下是对过去24小时内AI相关信息的总结,主要分为以下几个类别:
模型与API更新
- Gemini系列:
- 安卓版Gemini在部分功能上出现问题,如多步推理和连接YouTube/Google搜索时显示错误,但网页端正常。 (gemini连接错误)
- Gemini新出的
gemini-2.0-flash-exp-image-generation模型API似乎还不支持中转,有人在寻求中转文生图和图生图功能的方法。 (gemini新出的图像处理模型怎样中转) - 云雾API已支持
gemini-2.0-flash-exp-image-generation模型。 ([云雾API] gemini-2.0-flash-exp-image-generation 模型已支持](https://linux.do/t/topic/509326))
- Claude系列:
- Claude 3.7 在代码生成能力上有显著提升,一次对话可以生成一千多行代码。 (claude3.7太变态了,提升十五倍输出!!对话的情况下一次都能给一千多行代码)
- Claude3.7一次性输出token量大, Gemini可阅读200万上下文,AI开发能力今年或有质变。 (感觉今年AI开发的能力会有质变)
- Grok系列: Grok手机App已上架,包含Grok3 Beta和Grok2版本。 (Grok 手机app上架了) Grok3上线图片编辑功能,但效果有待提高。 (Grok3的图片编辑功能已上线,稍微体验一下)
- DeepSeek: 有用户分享了DeepSeek的资源汇总,包含越狱补丁、本地部署包、学习资料和AI网课合集。(2025 最新最全 DeepSeek 资源汇总(包含越狱补丁))
- API 需求:有人寻求知识库API的推荐,用于
cherrystudio+知识库+deepseek环境。 (求知识库api推荐) 也有人寻找国内外AI通用的API集成平台,最好能用国内方式充值。 (求AI api集成平台) - 通义千问: 有用户尝试通过API上传视频到通义千问,但发现似乎只能处理图片序列。 (通义千问有人通过API上传过视频吗,或者任意大模型支持视频理解的,要被搞炸了)
AI应用与工具
- AI内容检测:有人计划创建一个无AI内容平台,需要AI检测模型或API来过滤AI生成的内容。 (【AI检测】求AI检测的分类模型或者API)
- AI辅助简历分析:有人使用Grok、GPT和Deepseek分析简历,认为Deepseek的回复更准确具体,更适合国人使用。 (拿AI帮我分析简历)
- AI游戏:有人分享了一款名为"What Beats Rock Game"的创新游戏,基于石头剪刀布,但允许玩家输入任意物品进行对抗,结果由AI判定。 (AI 裁判+自由规则:重新定义「石头剪刀布」的脑洞对决)
- SRT字幕处理工具:开发者开源了一款SRT字幕标点去除工具,可以自定义去除的标点符号。 (开发了一个srt字幕一键去除标点的小工具,开源免费使用,需要的拿走)
- AI降噪方案: 有人寻求开源的AI降噪方案,用于实时音频流降噪,特别是在网页端使用,并要求低延迟和高质量。 (万能的 V 友,求解有没有开源方案可以实现 AI 降噪?)
- AI Labyrinth: Cloudflare 推出 AI Labyrinth,使用 AI 生成内容来减缓、迷惑不遵守抓取指令的 AI 爬虫。 (Cloudflare 宣布推出 AI Labyrinth)
Prompt工程与AI团队协作
- 提示词工程:有人分享了"Python AI智能开发团队3.0"的提示词工程,通过角色扮演和情景模拟,使AI更具人情味,并方便添加设定和转换编程语言。 (提示词工程:Python AI智能开发团队3.0)
行业动态
- OpenAI降价与合作:OpenAI计划大幅降低ChatGPT在印度的订阅费用,并与印度Reliance Industries洽谈合作,可能包括分销服务和本地托管模型。 (OpenAI拟大幅降低ChatGPT订阅费用并与印度Reliance洽谈合作, OpenAI拟大幅降低ChatGPT订阅费用并与印度Reliance洽谈合作)
学习资源
- 机器学习课程:台大李宏毅老师推出了新的机器学习系列课程《生成式AI時代下的機器學習 (2025)》,其中第四讲介绍了Transformer的竞争者。 (台大李宏毅老师新出的机器学习系列课程【生成式AI時代下的機器學習 (2025)】)
其他
- AI鉴别测试:一个帖子提供了一些文本,让参与者判断哪些是AI生成的。 (【AIGC判断能力测试】佬友们鉴别下哪个是AI写的
)