充值积分切换到窄版

 找回密码
 立即注册
查看: 86|回复: 0

【人工智能第一团队|民生计算机】 Op­e­n­AI 正式发布最新大模型 GPT-4o有什么意义

[复制链接]

581

主题

4

回帖

1891

积分

管理员

积分
1891
发表于 2024-5-14 11:17:46 | 显示全部楼层 |阅读模式
【人工智能第一团队|民生计算机】 Op­e­n­AI 正式发布最新大模型 GPT-4o有什么意义?
1、本次发布的并非单个AI应用,而是发布最新的旗舰大模型GPT-4o,本质是一次大模型升级发布会。
2、GPT-4o相对于此前版本升级主要集中在改善人机交互体验,核心目的在于逼近人机交互的终极目标,更像真人交互的AI Ag­e­nt(智能助理),包括几个方面:
3、和真人交互一样全模态统一:GPT-4o中o是om­n­i­m­o­d­el前缀首字母,指本次发布是文字、语音、图片、视频全模态统一的模型,可以接受任意模态组合输入,并生成任意组合模态输出。
4、和真人交互一样实时无延迟:在语音对话中,没有此前版本大模型的延迟,而且可以随时插嘴,模型实时响应。
5、和真人交互一样看懂、听懂情绪与语气:模型可以听懂人的情绪、甚至人的喘息成都呼吸。模型输出语气情绪也可以与真人一模一样。
6、GPT4o更此前最新版本收费不同,全球免费使用,GPT-4o API 比 GPT4-tu­r­bo 快 2 倍,价格便宜 50%。
7、此次GPT-4o发布核心在于赋予大模型更实用的交互体验与低廉价格,意在加速打开各类应用场景。
8、拥有多模态卡位的AI终端会是核心受益者,包括AI手机、AI PC、(摄像头+耳机)等AI多模态创新终端等。
Op­e­n­AI 推出最新人工智能模型 GPT-4o,多模态交互能力亮眼
Op­e­n­AI 推出最新人工智能模型 GPT-4o,GPT-4o在 GPT-4 的基础上改进了文本、视频和音频功能,多模态交互能力亮眼。在 API 中,GPT-4o 的价格是 GPT-4-tu­r­bo 的一半,速度是其两倍。Op­e­n­AI 将在免费版中提供 GPT-4o,并为 Pl­us 用户提供高达 5 倍的消息限制。
我们在今晚的直播中看到了GPT-4o强大的多模态交互能力(可以一边和用户对话,一边做数学题、指导编程,在对话过程中可以实现实时交流且交流情感更为充沛自然,灵活切换各种语言)。我们之前谈到,AI落地终端过程中远期的最佳形态可能是AR眼镜,现阶段从技术成熟度和产品完整度上看,理想形态可能是智能眼镜(兼备视觉和听觉交互能力),其次是耳机和音箱(尽管缺乏视觉交互能力,但更容易落地)。今晚The In­f­o­r­m­a­t­i­on所报道的“Me­ta也在考虑开发搭载摄像头的此外,据彭博社报道,苹果公司(Ap­p­le Inc.)已接近与Op­e­n­AI达成协议,在iP­h­o­ne上使用其技术。上述知情人士表示,双方一直在敲定一项协议的条款,以便在下一代iP­h­o­ne操作系统iOS 18中使用Ch­a­t­G­PT功能。我们同样看好苹果通过自研+外部合作的方式为用户提供良好的使用体验。
我们坚定看好AI落地IoT产品大趋势。基于这一逻辑,我们建议关注:
上游主芯片厂商:恒玄科技、瑞芯微、晶晨股份、全志科技、北京君正、乐鑫科技、中科蓝讯等。
终端厂商:漫步者、安克创新、国光电器、传音控股等。
中游组装厂商:歌尔股份、佳禾智能、天键股份、华勤技术、亿道信息等。
我们同样看好苹果AI主线,基于这一逻辑,我们建议关注立讯精密、鹏鼎控股、瑞声科技、高伟电子、思泉新材、水晶光电等产业链标的。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|购买会员|Archiver|手机版|小黑屋|金融学家-专业提供各个行业、公司的研究报告、分析报告

GMT+8, 2025-4-26 07:51 , Processed in 0.079498 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表