欢迎,AI 爱好者们!
OpenAI 刚刚推出了针对 GPT-4o 的免费微调,允许开发人员在 9 月 23 日之前免费定制最先进的 AI 模型。
但是,这一波超专业化 AI 模型将为各行各业的开发人员和 AI 应用带来什么?让我们开始吧……
——————————
概述:
1. OpenAI 为 GPT-4o 添加了免费微调
2. Claude 因侵犯版权被起诉
3. 微软的新 AI 击败了更大的模型
4. 更多 AI 和技术新闻
阅读时间:4 分钟
——————————
OpenAI 为 GPT-4o 添加了免费微调
摘要:
OpenAI 刚刚为 GPT-4o 推出了免费微调(截至 9 月 23 日,每天最多 100 万个 token),允许开发人员自定义模型以获得更高的性能和准确性。
详情:
开发人员现在可以首次对 GPT-4o 进行微调,以改进模型的结构、语气和特定于领域的指令,以用于他们的 AI 应用程序。
微调适用于所有付费使用层级,培训费用为每百万 token 25 美元,但在 9 月 23 日之前完全免费。
OpenAI 建议开发人员仅使用几十个训练示例就应该能看到微调的强大效果。
此外,谷歌的 Gemini API 每天在其 Gemini 1.5 Flash 模型上免费为开发人员提供 15 亿个 token,在其 Gemini 1.5 Pro 模型上免费提供 160 万个 token。
解读:
就在上周,一家公司获得了 GPT-4o 微调的早期使用权,生产了 Genie,并在 SWE-bench Verified(43.8%)和 Full(30.1%)基准测试中取得了最佳成绩。现在所有开发人员都可以免费进行微调,准备好迎接新一波更智能、更快、更强大的 AI 机器人吧。
Claude因侵犯版权被起诉
摘要:
一群作家对人工智能初创公司 Anthropic 提起诉讼,指控该公司通过盗版受版权保护的书籍训练其 Claude 聊天机器人,犯下了“大规模盗窃罪”。
详情:
这是作家针对 Anthropic 和 Claude 的第一起诉讼,但类似的诉讼也曾针对竞争对手 OpenAI 和 ChatGPT 提起。
该诉讼指控 Anthropic 使用名为 The Pile 的数据集,其中包括大量盗版书籍。
Anthropic 和包括 OpenAI 在内的其他公司认为,训练人工智能模型受到美国法律“合理使用”原则的保护,该原则允许有限使用受版权保护的材料。
解读:
这不是人工智能公司第一次因侵犯版权而被起诉,但它再次引发了关于人工智能训练数据的重要争论。尽管过去类似的案件大多被驳回,但法院尚未明确解决使用未经授权的网络抓取材料进行人工智能训练的核心问题。
微软的新 AI 击败了更大的模型
摘要:
微软刚刚发布了 Phi-3.5-MoE,这是一种先进的 AI 模型,其推理能力可与更大型模型相媲美,同时保持了紧凑高效的架构。
详情:
Phi-3.5-MoE 使用了一种新的专家混合 (MoE) 方法,该方法选择性地仅激活模型中与每项任务最相关的部分,以节省计算能力。
新模型擅长理解和遵循复杂的指令,并且可以在单个提示中处理多达约 125,000 个单词。
在面对面的基准测试中,Phi-3.5-MoE 的表现优于 Meta 的 Llama 3 8B 和 Google 的 Gemma 2 9B 等流行模型,但与 OpenAI 的 GPT-4o mini 相比略逊一筹。
微软在 Hugging Face 上根据开源 MIT 许可证提供了该模型。
解读:
虽然主流媒体关注的是最先进的大型语言模型,但科技巨头之间也在争夺最智能、最快和最小的人工智能。像 Phi-3.5-MoE 这样的突破为高级人工智能模型在我们的移动设备上直接和私密地运行铺平了道路。
Perplexity 推出了代码解释器升级,支持库安装和图表渲染,以实现 AI 驱动的数据可视化。
国际数据公司 (IDC) 预测,到 2028 年,全球 AI 支出预计将达到 6320 亿美元,其中生成式 AI 占 32%。
AI 影响者 Justin Fineberg 和 Cassidy AI 宣布筹集 370 万美元,用于构建可靠的 AI 工作流程的智能自动化平台。
CodeSignal 推出了 Conversation Practice,这是一款由 AI 驱动的工具,用于模拟工作场所对话并提供个性化反馈。
LTX Studio 向公众开放并推出了五项新功能,包括角色动画和对话、面部动作捕捉以及生成和关键帧控制。
世界第三大富豪 LVMH 创始人 Bernard Arnault 通过其家族办公室 Aglaé Ventures 在 2024 年投资了五家 AI 初创公司。
中国科学家开发了一种受大脑启发的 AI 网络模型,以解决高资源消耗和可解释性等挑战。
Nvidia 公布了数字人类和化身技术的进展,包括第一个用于游戏角色的小型人工智能语言模型 Nemotron-4 4B NIM。