欢迎,人工智能爱好者!
OpenAI 的新 ChatGPT 语音现在可以实时对话,并具有情感感知功能,但仅限于少数用户。
这是人机交互的未来吗?让探究探究……
———————————-
概述:
1. OpenAI 开始推出 ChatGPT Voice
2. 朋友的 AI 伴侣项链
3. Perplexity 的出版商收益分享
4. 更多 AI 和技术新闻
阅读时间:4 分钟
———————————-
OpenAI 开始推出 ChatGPT Voice
摘要:
OpenAI 已开始向 ChatGPT Plus 付费用户有限推出其备受期待的“高级语音模式”,提供自然的实时对话以及 AI 检测和响应情绪的能力。
详情:
该功能最初将向一小部分 ChatGPT Plus 用户开放,计划在 2024 年秋季之前向所有 Plus 用户开放。
高级语音模式使用 GPT-4o,可以感知用户声音中的情绪,包括悲伤、兴奋或歌唱。
之前在 OpenAI 的早期演示中展示的视频和屏幕共享功能将在“稍后”推出。
OpenAI 已向最初选定的“Alpha”组发送了电子邮件说明,以供早期访问。
解读:
人工智能正在慢慢从我们用来发短信/提示的工具转变为我们与之协作、学习和成长的智能。高级语音模式能够理解和回应实时对话中的情绪,在从客户服务到心理健康支持等各个领域都有广泛的用途。
朋友的 AI 伴侣项链
摘要:
哈佛大学辍学生、威比奖获得者 Avi Schiffmann 刚刚发布了 Friend,这是一款售价 99 美元的人工智能可穿戴设备,旨在通过提供持续的陪伴来对抗孤独。
详情:
Friend 是一款挂在脖子上的吊坠式设备,使用人工智能进行对话并提供情感支持。
该设备始终在倾听,并可以根据佩戴者的情况主动发送消息。
Friend 以 5000 万美元的估值从知名投资者那里筹集了 250 万美元的资金。
基本白色版本现已开放预订,预计 2025 年 1 月发货。
解读:
与其他人工智能可穿戴设备相比,Friend 采取了不同的方法,专注于陪伴而不是生产力。但是,由于市场充斥着过度承诺、隐私问题和对真实人际关系的担忧,这款吊坠在信任方面面临着一场艰苦的战斗。
Perplexity 的出版商收益分成
摘要:
Perplexity 刚刚推出了一项“出版商计划”,与媒体合作伙伴分享广告收入,以应对最近的抄袭指控,旨在支持人工智能搜索时代的优质新闻报道。
详情:
该计划包括未来收入的现金预付款,因为 Perplexity 正在构建其广告模式,该模式将于 9 月推出。
最初的合作伙伴包括《时代》、《明镜周刊》、《财富》、WordPress.com 等,他们将获得“两位数百分比”的广告收入。
合作伙伴还可以通过 Scalepost AI 免费访问 Perplexity 的 Enterprise Pro 层、开发人员工具和见解。
解读:
尽管人工智能公司及其训练数据不断受到抵制,但媒体公司除了接受合作协议外,几乎没有其他可行的出路。Perplexity 的举措是朝着公平迈出的良好一步,但它可能不会结束出版商的成长烦恼。
更多热点…
Midjourney 发布 V6.1,改进了图像质量、连贯性和文本渲染,并采用了新的升级和个性化模型,提供更快的处理速度和增强的整体美感。
SoundHound AI 在欧洲各地的阿尔法罗密欧和雪铁龙汽车中推出了集成 ChatGPT 的 Chat AI 语音助手,扩大了其在 Stellantis 品牌中的影响力,并为驾驶员提供了增强的对话体验。
Activision 开源了《使命召唤:战区》中的“Caldera”地图,为游戏行业的学术使用、AI 训练和内容生成研究提供了全面的数据集。
Leonardo.Ai 宣布被 Canva 收购,旨在加速其 AI 驱动的创意平台的创新,同时保持独立性并扩大研究能力。
由李开复创立的 01.AI 推出了 Yi-Vision,这是一种专为复杂视觉任务、图像理解和分析而设计的新型视觉语言 API。
NVIDIA 的 Project GR00T 引入了一种扩展机器人数据的新方法,使用 Apple Vision Pro 进行远程操作、使用 RoboCasa 进行环境模拟、使用 MimicGen 进行运动,从而有可能彻底改变机器人数据收集方式。