"); //-->
据德国媒体Heise报道,当地时间3月9日,微软德国CTO Andreas Braun在一场AI活动中表示,GPT-4将于下周发布,并且是多模态,不仅仅局限于文字,还包括视频。与此同时,Braun还强调GPT-4能够适用所有的语言,用户可以用德语提问,然后获得意大利语的答案。
图片来源于Heise微软德国CEO Marianne Janik就AI对业界的颠覆性影响展开了讨论。她坦言,当前人工智能的发展迎来了“iPhone时刻”。AI并非要替代人类工作,而是帮助人类用不同的方式来完成重复性的工作。
Janik强调,AI并不会造成人类的失业。传统的工作方式会发生变化,全新的职业也许会产生。她建议各家公司成立培训中心,来培训公司员工运用AI工具。与此同时,Janik还表示,微软不会使用客户的数据来训练模型。
微软AI技术专家Holger Kenn和Clemens Sieber解读了多模态AI的相关功能。Kenn表示,多模态AI不仅能够将文本转变成图像,还可以转变成音乐和视频。他强调,尤其是在编程领域,Codex和Copilot等AI模型能够更轻松的生成样板代码,让编程更容易。
Sieber则介绍了一些多模态AI产业化的潜在案例,例如多模态AI能够将电话呼叫的语音直接记录成文本。据其测算,该功能能够为微软在荷兰的一家大客户每天节省高达500个工作小时。
当被问及AI的可靠性时,Sieber表示,AI并不能够总是给出正确的答案,因此有必要验证。微软目前正在创建相关指标来解决此问题。
不难看出,多模态是微软当前主要的发力点。近一周,微软还发布了多模态AI大模型Kosmos-1,和本次曝光的GPT-4一样,Kosmos-1同样也可以处理文本、音频、图像和视频等多方面的内容。
受该消息提振,午后视频AIGC概念股当虹科技、苏州科达迅速拉升,截至收盘,当虹科技股价上涨13.56%;苏州科达涨停。
国盛证券刘高畅指出,多模态模型使输入输出信号超越语言,有望极大刺激视频处理的需求。因此,分析师建议关注视频、视觉领域相关企业:
从应用场景来看,广发证券指出,多模态技术的发展将拓宽下游应用场景,底层技术的进步反映在更接近C端的应用层,应用的不断落地标志着AIGC行业进入发展的新阶段,商业化变现空间可期。
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。