GPT-4下周揭开面纱！多模态成最大看点

科创板日报 | 2023-03-19 08:50:37 阅读：237

据德国媒体Heise报道，当地时间3月9日，微软德国CTO Andreas Braun在一场AI活动中表示，GPT-4将于下周发布，并且是多模态，不仅仅局限于文字，还包括视频。与此同时，Braun还强调GPT-4能够适用所有的语言，用户可以用德语提问，然后获得意大利语的答案。

图片来源于Heise

微软德国CEO Marianne Janik就AI对业界的颠覆性影响展开了讨论。她坦言，当前人工智能的发展迎来了“iPhone时刻”。AI并非要替代人类工作，而是帮助人类用不同的方式来完成重复性的工作。

Janik强调，AI并不会造成人类的失业。传统的工作方式会发生变化，全新的职业也许会产生。她建议各家公司成立培训中心，来培训公司员工运用AI工具。与此同时，Janik还表示，微软不会使用客户的数据来训练模型。

微软AI技术专家Holger Kenn和Clemens Sieber解读了多模态AI的相关功能。Kenn表示，多模态AI不仅能够将文本转变成图像，还可以转变成音乐和视频。他强调，尤其是在编程领域，Codex和Copilot等AI模型能够更轻松的生成样板代码，让编程更容易。

Sieber则介绍了一些多模态AI产业化的潜在案例，例如多模态AI能够将电话呼叫的语音直接记录成文本。据其测算，该功能能够为微软在荷兰的一家大客户每天节省高达500个工作小时。

当被问及AI的可靠性时，Sieber表示，AI并不能够总是给出正确的答案，因此有必要验证。微软目前正在创建相关指标来解决此问题。

不难看出，多模态是微软当前主要的发力点。近一周，微软还发布了多模态AI大模型Kosmos-1，和本次曝光的GPT-4一样，Kosmos-1同样也可以处理文本、音频、图像和视频等多方面的内容。

受该消息提振，午后视频AIGC概念股当虹科技、苏州科达迅速拉升，截至收盘，当虹科技股价上涨13.56%；苏州科达涨停。

国盛证券刘高畅指出，多模态模型使输入输出信号超越语言，有望极大刺激视频处理的需求。因此，分析师建议关注视频、视觉领域相关企业：

从应用场景来看，广发证券指出，多模态技术的发展将拓宽下游应用场景，底层技术的进步反映在更接近C端的应用层，应用的不断落地标志着AIGC行业进入发展的新阶段，商业化变现空间可期。

*博客内容为网友个人发布，仅代表博主个人观点，如有侵权请联系工作人员删除。